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自 人 类 结 绳 记事 起 ,数据 即 如 涓涓 细 流 , 润 物 无 声 地 流 消 过 历史 的 每 一 
个 瞬间 ,产生 抑或 潭 灭 , 无 止 无 息 。 人 类 的 历史 是 数据 的 历史 ,人 类 的 未 来 
亦 是 数据 的 未 来 。 

近年 来 , 随 着 新 一 代 信 息 技术 的 应 用 和 全 球 智 慧 城市 的 规模 化 发 展 , 人 
类 社会 和 虚拟 世界 的 边界 迅速 向 物理 空间 延伸 ,各 行 各 业 的 数据 呈现 爆发 
式 增长 “人 -机 - 物 ” 三 元 世界 的 融合 正在 加 速 形成 。 大 数据 的 “ 魔 盒 ”一 经 开 
启 ,传统 行业 的 颠覆 随 之 到 来 。 如 何 应 对 信息 革命 带 来 的 社会 变革 ,并 借助 
历史 潮流 的 趋势 ,推动 人 类 社会 在 变革 中 持续 进步 ,是 每 一 位 数据 科学 家 、 
经 济 学 家 、 系 统 学 家 、 社 会 学 家 ,企业 家 及 相关 行业 的 管理 者 和 从 业者 所 共 
同 面 对 的 重大 课题 。 

钱学森 先生 在 1990 年 自然 杂志 第 1 期 中 发 表 了 著名 文章 (一 个 科学 新 
领域 一 一 开放 的 复杂 巨 系 统 及 其 方法 论 》。 智 慧 城市 作为 一 个 “开放 的 复杂 
巨 系统 ”, 城 市 本 身 与 周围 的 环境 有 物质 、 能 量 和 信息 的 交换 ,同时 城市 系统 
下 又 包含 数量 庞大 、 种 类 繁多 的 子 系统 。 随 着 城市 管理 从 “经 验 治理 ”向 以 
信息 为 核心 的 “科学 治理 "加速 转变 , 跨 部 门 、 跨 领域 . 跨 层级 、 跨 主体 的 多 源 
信息 协同 是 保障 城市 系统 中 其 他 资源 要 素 优化 配置 的 基础 ,也 是 城市 更 加 
智慧 运行 的 前 提 。 

在 科学 命题 的 哲学 范畴 里 ,大 数据 的 智慧 正如 同 拉 普 拉 斯 宿命 论 式 的 
畅想 :“ 有 一 种 智能 ,在 任 一 瞬间 里 都 能 识别 所 有 移动 的 力 , 以 及 力 与 力 相 互 
之 间 的 状况 。 最 好 是 能 得 到 足够 巨 量 的 数据 来 分 析 , 用 同一 种 程序 既 能 分 
析 宇 宙 中 最 大 的 天 体 的 运动 ,也 可 以 分 析 最 轻 的 原子 的 运动 。 没 什么 是 不 
能 确定 的 ,对 于 这 种 分 析 程 序 来 说 ,未 来 就 像 过 去 一 样 看 得 清 清楚 楚 。” 
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对 城市 和 区 域 级 的 复杂 巨 系 统 而 言 , 数 据 集 随时 处 于 量 级 的 增长 和 维 
度 的 变化 中 ,原始 形态 的 大 数据 一 般 不 容易 被 验证 和 确认 ,大 数据 分 析 的 过 
程 和 方法 也 难以 被 完整 地 复制 。 因 此 ,我 们 试图 从 信息 协同 的 视角 出 发 , 探 
讨 信 息 在 城市 系统 中 的 流转 模式 ,通过 信息 将 人 、 地 、 事 、 物 .组织 关联 起 来 ， 
形成 一 个 以 数据 为 核心 的 统一 有 机 体 ;在 此 基础 上 ,分 析 一 个 复杂 巨 系 统 的 
运行 机 理 和 发 展 规律 ,并 进一步 解读 城市 和 区 域 级 大 数据 的 应 用 和 演变 
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本 书 内 容 聚 焦 城 市 化 和 信息 化 的 交叉 领域 ,涉及 城市 管理 .信息 科学 、 
计算 科学 .系统 科学 .决策 科学 、 模 糊 数学 .统计 学 .社会 网 络 分 析 等 多 个 学 
科 。 主 要 分 为 三 篇 : 

上 篇 ”全球 趋势 篇 (第 1、2 章 ): 从 全 球 智慧 城市 规模 化 发 展 和 新 一 代 
信息 技术 普及 应 用 的 视角 出 发 ,介绍 智慧 城市 大 数据 的 战略 诉求 与 协同 
应 用 。 

中 篇 ”协同 体系 篇 (第 3 一 6 H): 以 智慧 城市 为 对 象 ,介绍 复杂 巨 系 统 
下 的 多 源 信息 协同 的 标准 体系 、 自 适应 模式 和 总 体 架构 设计 。 

下 篇 ”内 生 结 构 篇 (第 7、8 章 ): 介绍 多 源 信息 协同 网 络 结构 的 差异 测 
度 和 关系 测度 方法 ,及 其 相应 的 模式 优化 策略 。 

本 书 原则 上 不 对 基础 理论 和 技术 工具 的 应 用 进行 普及 性 介绍 。 为 保证 
理论 体系 的 完整 性 ,对 群体 决策 .模糊 聚 类 、 凝 聚 子 群 等 关键 概念 和 方法 进 
行 必要 描述 。 感 兴趣 的 读者 请 自行 查阅 相关 专业 书籍 和 研究 文献 。 

本 书 对 外 部 内 容 和 观点 的 引用 按 原始 出 处 列 人 参考 文献 ,在 此 向 所 引 
内 容 和 观点 的 作者 表示 感谢 。 如 有 因 各 种 原因 造成 的 引 注 错误 或 疏漏 ,请 
广大 读者 及 时 指出 。 为 了 方便 理解 和 开展 进一步 研究 ,本 书 给 出 了 相关 案 
例 的 核心 程序 和 关键 计算 数据 ,欢迎 读者 合理 使 用 并 规范 引 注 。 

本 书 受 “国家 自然 科学 基金 ”(71172040)、“ 中 国 传媒 大 学 优秀 中 青年 教 
师 培养 工程 ”项 目 支持 。 全 书 由 贾 晓 丰 主 持 编 写 和 统 稿 。 

本 书 付 梓 之 际 ,特别 感谢 中 国 科 学 院 的 陈 锐 研 究 员 、 赵 宇 博士 \ 王 宁 宁 
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博士 及 工信部 情报 所 、 清 华 大 学 ,北京 大 学 .北京 航空 航天 大 学 .中 国人 民 大 
学 .首都 经 济 贸易 大 学 的 相关 专家 和 学 者 提出 的 宝贵 意见 。 

限于 作者 的 学 识 水 平 , 书 中 错误 及 不 妥 之 处 在 所 难免 ,县 请 广大 读者 和 
业界 同仁 不 音 赐教 。 希望 本 书 能 够 为 智慧 城市 信息 化 顶层 设计 和 区 域 级 信 
息 协 同 的 理论 与 实践 起 到 一 定 参考 作用 ,为 我 国 城市 化 和 信息 化 事业 的 蓬 
勃发 展 尽 微薄 之 力 。 
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智慧 城市 大 数据 的 战略 诉求 与 协同 应 用 


信息 化 水 平 是 当代 社会 生产 力 的 重要 标志 ,信息 化 的 终极 : 
目标 是 利用 信息 技术 将 人 类 社会 与 信息 空间 ,物理 世界 相互 融 
合 ,形成 “人 -机 - 物 "三 元 一 体 的 世界 。 作 为 城市 发 展 的 高 级 阶 ` 
段 , 智 慧 城市 正在 从 “经 验 治理 ”向 以 信息 为 核心 的 “科学 治理 ” 
加 速 转 变 ,城市 大 数据 的 协同 应 用 是 转变 过 程 中 解决 “智慧 孤 
岛 "、 重 构 产 业 格 局 的 核心 助 推 器 。 
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第 1 章 智慧 城市 与 城市 大 数据 


11 全 球 智 慧 城 市 规模 化 发 展 


随 着 信息 网 络 的 高 速 发 展 , 资 本 和 劳动 力 的 全 球 流动 性 增加 ,大 规模 的 
城市 化 运动 在 全 球 展 开 。 根 据 2010 年 3 月 25 日 联合 国 经 社 事务 部 人 口 司 
在 纽约 总 部 发 布 的 (世界 城市 化 展望 2009 年 修正 版 ) 报 告 ,到 2050 年 人 口 总 
数 将 达到 97 亿 人 ,生活 在 城市 中 的 人 口 将 达到 64 亿 人 ,中 国 的 城市 人 口 预 
测 超过 70%% 。 全 球 城 市 化 在 推动 经 济 社会 发 展 的 同时 也 带 来 了 许多 无 可 逃 
人 避 的 问题 ,如 城市 人 口 拥挤 、 工 业 污染 ,垃圾 污染 交通 拥堵 ,资源 短缺 等 种 
种 城市 病 已 经 成 为 影响 城市 未 来 发 展 的 重要 障碍 ,其 根本 原因 在 于 传统 城 
市 在 社会 管理 和 服务 上 的 滞后 。 为 解决 这 些 问 题 ,实现 社会 经 济 的 可 持续 
发 展 ,全 球 许多 国家 提出 了 智慧 城市 建设 ,城镇 化 和 信息 化 成 为 当今 时 代 的 
发 展 主题 。 智 慧 城市 是 人 类 文明 的 集中 体现 和 综合 应 用 ,是 当代 城市 发 展 
的 毁 新 模式 ,也 是 城市 信息 化 发 展 的 高 级 阶段 ,已 在 全 球 范 围 内 成 为 一 种 
趋势 。 


111 关于 智慧 城市 内 涵 的 讨论 


目前 ,业界 对 于 智慧 城市 内 涵 的 探讨 大 致 分 为 三 类 : 

第 一 类 侧重 技术 的 重要 性 ,认为 智慧 城市 是 信息 化 .工业 化 和 城镇 化 高 
度 融合 的 结果 ,智慧 城市 中 信息 技术 呈现 泛 在 化 ,效用 化 、 智 能 化 ` 绿 色 化 和 
软 性 化 的 “五 化 "特征 ,强调 通过 新 一 代 信 息 技术 来 实现 城市 感知 .互联 和 智 
能 的 特性 ,使 整个 城市 系统 高 效 、 智 能 ,协调 运作 。 

第 二 类 侧重 最 终 实 现 的 愿景 ,认为 智慧 城市 的 概念 有 狭义 和 广义 之 分 ， 
技术 只 是 智慧 城市 的 一 种 实现 手段 ,智慧 城市 的 完整 内 涵 应 该 涵盖 全 民 参 


与 ,城市 居民 生活 质量 的 提高 、 个 性 化 需求 的 满足 城市 生态 空间 的 开放 与 
创新 等 多 个 方面 。 

第 三 类 侧重 “城市 化 ”与 “信息 化 ”的 结合 ,认为 智慧 城市 应 该 建立 在 一 
种 “具有 思维 的 " 且 “ 内 生性 的 ”科技 与 社会 相互 作用 的 过 程 之 中 ,将 智慧 城 
市 同 技术 发 展 与 资源 观念 的 演变 联系 在 一 起 。 

在 应 用 层面 上 ,目前 国内 外 对 智慧 城市 的 理解 主要 聚焦 在 三 个 层面 : 一 
是 空间 维度 ,重点 体现 在 智慧 社区 和 智慧 园区 的 建设 ;二 是 行业 维度 ,主要 
体现 在 教育 ` 卫 生 .文化 旅游. 航运、 物流 等 不 同 领域 对 未 来 发 展 的 新 需求 ; 
三 是 管理 维度 ,主要 体现 在 如 何 为 整体 的 智慧 城市 建设 营造 更 好 的 环境 。 

综合 来 看 ,智慧 城市 就 是 通过 新 一 代 信息 技术 ,迅速 灵活 地 处 理 各 种 
事项 ,实现 城市 智慧 化 运行 与 管理 的 状态 。 在 本 质 上 ,智慧 城市 是 城市 经 济 
发 展 模式 创新 在 特定 空间 上 的 具体 体现 ,是 城市 发 展 的 新 模式 和 新 形态 ,是 
人 类 在 城市 化 进程 中 ,实现 人 与 人 、 人 与 城市 和 自然 高 度 融 合 .协调 发 展 的 
更 高 阶段 ,通过 全 信息 链 应 用 体系 ,使 城市 具有 正确 理解 和 处 理 政 府 、 企 业 、 
居民 所 涉及 的 各 种 活动 的 能 力 ,实现 互联 和 互通、 迅速 灵活 、 高 效 优质 协同 共 
享 的 目标 。 


112 全 球 视野 下 的 差异 化 发 展 与 共性 聚焦 


自从 2009 年 初 IBM 提出 “智慧 地 球 ” 的 概念 以 来 ,美国 .日 本 、 荷 兰 、 英 
国 、 瑞 典 、 韩 国 、 新 加 坡 等 发 达 国 家 和 地 区 相继 发 布 了 建设 智慧 城市 的 相关 
规划 和 政策 ,全 面 开展 智慧 城市 的 建设 。 

(1) 美国 : 美国 提出 了 加 强 智慧 型 基础 设施 建设 和 推进 智慧 应 用 项 目 
的 经 济 刺激 计划 ,借助 于 发 展 智能 电网 等 基础 设施 ,致力 于 培育 更 多 的 新 兴 
产业 和 新 兴 服 务 。 其 中 ,纽约 市 在 应 急 保 障 与 社会 安全 体系 建设 圣地亚哥 
市 在 智能 电表 和 清洁 能 源 应 用 、. 迪 比 克 市 在 水 、 油 、 交 通 等 城市 资源 协同 服 
务 等 方面 均 取得 了 显著 成 效 。 

D 欧盟 : 欧盟 制定 了 智慧 城市 框架 ,重点 加 强 在 气候 问题 应 对 和 节能 
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减 排 方面 的 投入 ,提出 “20/20/20 by 2020” 的 战略 目标 , 即 相 对 于 1990 年 ， 
在 2020 年 实现 温室 气体 减 排 20% ,将 可 再 生 能 源 的 使 用 比率 提高 20% , 节 
能 20%。 为 实现 三 个 20% 的 目标 ,欧盟 各 大 城市 纷纷 加 快 启动 智慧 城市 建 
设 示 范 项 目 。 

G) 亚洲 : 亚洲 以 韩国 .日 本 和 新 加 坡 为 代表 ,在 大 力 开展 国内 智慧 城 
市 建设 的 基础 上 ,面向 新 兴 经 济 体 出 口 智慧 城市 产品 和 解决 方案 。 韩 国 、 日 
本 先后 在 U-Korea .U-Japan 的 国家 战略 规划 基础 上 推出 了 进一步 的 升级 计 
划 。 韩 国 以 泛 在 网 络 为 基础 ,在 首尔 \ 松 岛 等 地 开展 了 U-City 智慧 城市 建设 
试点 ;釜山 的 云 计算 即 付 即 用 模式 、 济 州 岛 的 智慧 岛 项 目 等 均 是 韩国 基础 设 
施 与 服务 出 口 的 典范 。 日 本 的 智慧 城市 建设 涵盖 新 能 源 汽车 .智能 电网 、 智 
能 家 庭 .节能 环保 等 多 领域 的 “多 元 化 发 展 ”, 强 调 跨 领 域 的 协同 合作 。 例 如 
横滨 在 能 源 、 建 筑 ,交通 等 领域 协同 发 展 ,通过 引入 新 技术 降低 碳 排放 。 除 
此 之 外 ,新 加 坡 提 出 2015 年 建成 “智慧 国 " 的 计划 ,台湾 地 区 提出 建设 “智慧 
台湾 ”的 发 展 战略 等 , 均 是 在 结合 地 区 特色 和 战略 定位 的 基础 上 ,寻求 各 自 
智慧 城市 发 展 的 切入 点 。 

当前 ,全球 的 智慧 城市 建设 在 规模 化 扩张 的 同时 ,已 逐渐 凸显 出 各 自 的 
发 展 方向 和 区 域 特色 ,如 维也纳 的 智能 电网 、 多 伦 多 的 循环 经 济 、 东 京 的 移 
动 智能 \ 伦 敦 和 瑞典 的 智慧 交通 、 巴 黎 的 自行 车 共享 、 德 国 的 电动 汽车 、 哥 本 
哈 根 的 创新 清洁 技术 .巴塞罗那 的 光伏 产业 等 。 然 而 从 全 球 视野 来 看 ,不 同 
国家 和 地 区 的 差异 化 发 展 过 程 中 ,又 进一步 呈现 出 了 领域 重点 的 聚焦 ,如 社 
会 服务 的 智能 化 与 个 性 化 以 及 城市 治理 的 协同 开放 。 


113 国内 智慧 城市 建设 的 政策 背景 与 信息 壁垒 


根据 工信部 2013 年 第 1 号 通告 ,截至 2012 年 年 底 我 国 已 有 320 个 城市 
投入 3000 亿 元 建设 智慧 城市 ,智慧 城管 .智慧 e 通 等 一 系列 信息 化 服务 走 进 
百姓 生活 。 北 京 、 上 海 .广州 深圳、 宁波、 扬州 杭州 .南京 .海口 等 各 大 城市 
均 结 合 当地 区 域 的 特点 和 需求 ,制订 了 各 自 的 发 展 规划 ;同时 ,在 城市 普遍 


面临 的 各 类 “城市 病 ” 和 关键 问题 上 ,也 显现 出 了 一 定 的 共识 。 

2013 年 8 月 ,国务 院 发 布 的 (关于 促进 信息 消费 扩大 内 需 的 若干 意见 》 
明确 提出 “加 快 智慧 城市 建设 ”。 同 年 ,工业 和 信息 化 部 等 八 部 委 联 合 起 草 
了 《关于 促进 我 国 智慧 城市 健康 发 展 的 指导 意见 》 的 征求 意见 稿 。2013 年 1 
月 29 日 ,住房 和 城乡 建设 部 公布 了 首 批 国家 智慧 城市 试点 名 单 , 共 90 个 城 
市 ;8 月 5 日 ,公布 了 第 二 批 名 单 , 共 103 个 城市 (区 、 县 、 镇 ) 试 点 ;2015 年 4 
月 7 日 公布 了 第 三 批 名 单 , 共 84 个 城市 (区 县、 镇) 试点 及 13 个 城市 (区 、 
县 ) 扩 大 范围 试点 。2013 年 11 月 21 日 ,中 欧 城镇 化 伙伴 关系 论坛 分 别 确定 
了 中 欧 15 个 试点 城市 ,共同 作为 中 欧 智慧 城市 合作 试点 城市 。2014 年 8 
月 ,国家 发 展 改革 委 等 八 部 委 联 合 下 发 (关于 促进 智慧 城市 健康 发 展 的 指导 
意见 》, 进 一 步 推 动 和 规范 智慧 城市 建设 进程 。 智 慧 城市 已 成 为 拉动 城市 升 
级 、 经 济 转型 和 改善 民生 的 战略 选择 。 

国务 院 副 总 理 马 凯 同 志 在 2014 4 2 H 18 日 召开 的 全 国 物 联网 工作 电 
视 电 话 会 议 中 明确 要 求 "扎实 推进 物 联 网 有 序 健康 发 展 ,在 食品 安全 、 社 会 
保障 、 医 疗 卫生 ` 城 市 管理 .民生 服务 、 公 共 安 全 等 领域 开展 应 用 示范 >。 以 
物 联 网 ` 云 计算 、 移 动 互联 网 ,大 数据 为 代表 的 新 一 代 信 息 技术 对 推动 创新 
浪潮 和 产业 革命 .建设 现代 信息 技术 产业 体系 具有 重大 战略 意义 。 

当前 ,我 国 的 智慧 城市 建设 处 于 基础 设施 建设 和 领域 示范 应 用 的 起 步 
阶段 ,涉及 社会 管理 `. 应 用 服务 .基础 设施 .智慧 产业 、 安 全 保障 、 建 设 模式 、 
标准 体系 等 内 容 ,智慧 城 市 的 架构 模式 、 标 准 规范 .关键 技术 .评价 体系 等 均 
不 成 熟 。 作 为 后 IP 时 代 跨 越 信息 壁垒 的 关键 突破 口 ,以 物 联 网 为 引领 的 智 
慧 应 用 建设 在 解决 一 个 个 信息 孤岛 的 同时 ,不 可 避免 地 又 形成 了 领域 间 的 
新 的 智慧 孤岛 。 信 息 协同 对 于 智慧 城市 大 数据 管理 的 重要 性 日 益 凸显 。 进 
和 人 大 数据 时 代 , 智 慧 城市 建设 的 关键 不 再 是 数字 城市 建设 中 的 信息 化 系统 ， 
而 是 面向 城市 和 区 域 系统 下 的 多 源 信息 的 实时 融合 ,在 城市 范围 内 实现 跨 
领域 的 信息 协同 共享 ,支撑 跨 部 门 的 协同 联动 和 智慧 城市 的 精细 化 管理 。 
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114 智慧 城市 评价 体系 百家争鸣 


目前 ,业界 关于 智慧 城市 的 评价 指标 体系 尚未 形成 统一 的 标准 和 共识 ， 
普遍 缺少 有 效 的 定量 依据 和 经 过 实证 检验 的 模型 支撑 。 

国外 方面 ,欧盟 从 智慧 产业 、 智 慧 民 众 ` 智 慧 治 理 、 智 慧 移动 .智慧 环境 
和 智慧 生活 等 六 个 维度 对 智慧 城市 建设 进行 了 评价 研究 ;智慧 社区 论坛 
(ICF) 从 宽带 连接 、 知 识 型 劳动 力 、 创 新 数字 包容 、 营 销 和 宣传 等 五 个 维度 
对 智慧 社区 的 发 展 水 平 进行 了 定性 的 评估 ;Boyd Cohen 认为 智慧 城市 是 借 
助 信息 通信 技术 来 发 挥 其 重要 作用 的 ,为 城市 创新 和 环保 经 济 提供 了 支撑 。 
智慧 城市 可 以 通过 降低 城市 运行 成 本 ,节约 资源 、 减 少 环境 污染 来 提高 城市 
服务 水 平和 居民 生活 质量 ,提出 城市 创新 与 城市 化 可 持续 发 展 将 成 为 智慧 
城市 的 评价 标准 。 

国内 方面 ,上 海 浦东 于 2011 年 7 月 发 布 了 首 个 中 国 版 本 的 智慧 城市 指 
标 体系 ,包含 19 个 二 级 指标 和 64 个 三 级 指标 ,涉及 城市 基础 设施 .公共 管理 
和 服务 ,城市 信息 服务 经 济 发 展 、 人 文科 学 素养 .城市 民主 感知 等 五 个 维度 ; 
此 外 , 陈 铭 、 李 贤 角 . 李 健 、 顾 德 道 等 学 者 从 不 同 的 角度 提出 了 智慧 城市 发 展 
水 平 评 价 指标 体系 ,其 中 一 级 指标 主要 集中 在 智慧 基础 设施 .智慧 应 用 、 智 
慧 产 业 、 智 慧 人 群 . 智 慧 服务 等 方面 。 


12 城市 大 数据 与 新 一 代 信息 技术 应 用 


1.21 全 球 加速 迈 入 大 数据 时 代 


随 着 科学 技术 的 进步 和 人 类 社会 信息 化 进程 不 断 推进 ,数据 产生 成 本 
的 下 降 、 投 资 规模 的 增加 和 数据 存储 能 力 的 增长 ,使 人 类 所 面临 的 数据 量 呈 
现 出 前 所 未 有 的 爆炸 性 增长 。 


1 无 所 不 在 的 数据 增长 源 

不 知 不 觉 中 ,数据 增长 源 已 遍布 我 们 每 个 人 的 周围: 

。 社交 网 络 、 电 子 商务 网 站 、 视 频 网 站 等 互联 网 应 用 和 服务 产生 了 大 量 
数据 。2011 年 被 创建 和 被 复制 的 数据 总 量 为 1. 8ZB (1ZB = 
1024EB), 远 远 超 过 人 类 有 史 以 来 所 有 印刷 材料 的 数据 总 量 
(200PB) 。 例 如 Facebook 每 月 上 传 的 照片 超过 10 亿 张 ,每 天 生成 
300TB 以 上 的 日 志 数据 ;淘宝 网 会 员 超 过 3. 7 亿 人 ,每 天 交易 数 千 万 
笔 ,产生 约 20TB 数据 。 

。 物 联网 和 移动 计算 蓬勃 发 展 产生 规模 更 加 巨大 的 数据 洪流 。 预 计 至 
2020 年 ,全球 将 有 500 亿 个 终端 感知 设备 连 人 互联 网 ,产生 的 流 数 
据 量 将 十 分 惊人 。 

。 科 学 研究 (如 基因 组 学 、 天 体 物理 学 和 脑 科学 等 ) 也 产生 了 大 量 数 据 。 
例如 ,用 电子 显微镜 重建 大 脑 中 的 突 触 网 络 ,1 立方 毫米 大 脑 的 图 像 


数据 就 超过 了 1PB。 
IDC 认为 ,全 球 数据 增 速 符合 大 数据 摩尔 定律 (又 称 新 摩尔 定律 ), 大约 dabii 


每 两 年 翻 一 番 。 预 计 到 2020 年 ,全球 数 据 量 将 达到 35ZB, 年 均 增长 率 则 超 
过 了 40% ,是 2010 年 的 29 倍 , 如 图 1.1 所 示 。 
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图 1.1 2005 一 2020 年 全 球 数 据 量 及 预测 


庞大 的 数据 量 及 其 处 理 和 应 用 需求 催生 了 “大 数据 概念 ”, 也 预示 着 大 
数据 时 代 的 来 临 。 按 维基 百科 的 定义 ,大 数据 是 指 规模 巨大 到 无 法 通过 目 7 
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念 是 数据 对 象 .技术 与 应 用 三 者 的 统一 ,其 基本 特征 包括 四 个 方面 ( 即 通常 
所 说 的 4V) : 数据 规模 巨大 (Volume) ,数据 类 型 繁多 (Variety) ,数据 处 理 速 
度 要 求 快 (Velocity) .数据 价值 密度 低 (Value) 。 

2 全 球 数 据 的 分 布 与 增长 

根据 2012 年 12 月 IDC 发 布 的 数据 ,美国 拥有 全 球 最 多 的 数据 (32%)， 
其 次 分 别 为 西欧 (19%)、 中 国 (13%) 和 印度 (4%)。 全 球 其 他 国家 和 地 区 拥 
有 剩 下 的 32% ,与 美国 一 国 所 拥有 的 数据 量 大 致 相当 。 全 球 数据 地 理 位 置 
分 布 如 图 1. 2 所 示 。 


其 他 国家 
或 地 区 32% 


美国 32% 


印度 4% 


中 国 13% 西欧 19% 


总 量 : 2837EB 


图 1.2 全 球 数据 地 理 位 置 分 布 


(资料 来 源 : IDC's Digital Universe Study，sponsored by EMC) 


基于 互联 网 资源 和 技术 优势 ,美国 已 具备 对 全 球 网 络 空间 的 监视 控制 
能 力 。 斯 诺 登 披露 的 “棱镜 ”计划 , 缘 于 美国 政府 的 “ 星 风 ” 监 视 计划 。2004 
年 ,布什 政府 通过 司法 程序 ,将 “ 星 风 ”监视 计划 分 拆 成 由 国家 安全 局 执行 的 
4 个 监视 计划 , 除 * 棱 镜 ” 外 ,还 包括 "主干 道 "“ 码 头 ” 和 "核子 ”。 其 中 ，“ 棱 
镜 ” 用 于 监视 互联 网 个 人 信息 和 核子 " 则 主要 负责 截获 电话 通话 者 对 话 内 容 
及 关键 词 ;“ 主 干道 ”和 “码头 ”分 别 对 通信 和 互联 网 上 数 以 亿 兆 计 的 “元 数 
据 ? 进 行 存储 和 分 析 .“ 元 数据 ?主要 指 通话 或 通信 的 时 间 、 地 点 ,使 用 的 设 
备 及 参与 者 等 ,不 包括 电话 或 邮件 等 的 内 容 。 


根据 麦肯锡 全 球 研究 中 心 2010 年 的 数据 ,全 球 新 增 数 据 量 地 理 分 布 如 
图 1. 3 所 示 。 
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图 1.3 全 球 新 增 数 据 量 地 理 分 布 


(资料 来 源 : IDC storage reports; McKinsey Global Institute analysis) 

我 国 拥 有 全 球 第 一 的 人 口 数 、 互 联网 用 户 数 和 移动 互联 网 用 户 数 ,数据 
存量 和 潜在 增 量 位 居 世 界 前 列 。 互 联网 和 各 行业 信息 化 系统 经 过 多 年 发 展 
沉淀 下 来 的 数据 量 已 经 十 分 庞大 。2012 年 ,中 国 的 数据 量 为 364EB, 占 全 球 
13%, 仅 电 人 信和、 金融、 医疗、 文化 等 国家 重要 基础 数据 总 量 就 超过 900PB。 
2013 4F 1~9 月 ,我 国 移动 互联 网 接 入 流量 累计 完成 927PB, 同比 增长 
67. 3% 32012 年 淘宝 网 每 天 交易 数 千 万 笔 , 单 日 数据 产生 量 超过 50TB; 百度 
存储 网 页 数量 已 接近 1 万 亿 页 ,每 天 处 理 60 亿 次 搜索 请 求 ,每 日 新 增 数据 
10TB, 处 理 数 据 超过 100PB; 上 海 证 券 交 易 所 每 秒 处 理 近 9 万 笔 业务 ,每 日 
成 交 3 亿 笔 以 上 ;中 国联 通用 户 上 网 记录 每 月 1 万 亿 条 ,产生 数据 300TB。 

未 来 , 随 着 制造 业 升级 改造 不 断 推进 ,金融 、 交 通 、 电 信 等 重点 行业 和 医 
保 、 社 保 、 海 关 等 重要 领域 的 业务 数据 不 断 集 中 ,我 国 数据 存量 将 持续 快速 
增长 。 预 计 到 2020 年 , 仅 中 国 就 将 产生 全 球 21% 的 数据 ,数据 量 超过 8ZB， 
年 均 增长 接近 50%。 
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1.22 城市 计算 与 城市 大 数据 


以 物 联 网 ` 云 计算 等 新 一 代 技术 为 核心 的 智慧 城市 建设 理念 ,已 成 为 一 
种 未 来 城市 发 展 的 全 新 模式 ,也 是 当前 全 球 城市 发 展 的 热点 。 智 慧 城 市 是 
人 类 社会 发 展 的 必然 产物 ,智慧 城市 的 建设 有 利于 解决 城市 发 展 问题 ,提升 
城市 信息 管理 水 平 ,促进 国家 高 端 产业 发 展 。 城 市 计算 是 智慧 城市 背景 下 ， 
城市 化 与 信息 化 结合 的 一 个 新 兴 领 域 。 在 对 城市 计算 的 概念 进行 界定 之 
前 ,首先 对 与 城市 计算 相关 的 新 一 代 信 息 技术 进行 定义 。 

(1) 物 联网 : 指 通过 射频 识别 (Radio Frequency Identification, RFID) , 
红外 感应 .卫星 定位 .激光 扫描 \ 视 频 监控 等 信息 传 感 设备 ,按照 约定 的 协 
议 ,把 物体 与 互联 网 连接 起 来 ,进行 信息 交换 和 通信 ,以 实现 智能 化 识别 、 定 
位 .跟踪 ,监控 和 管理 的 一 种 网 络 或 智慧 管理 环境 。 物 联网 是 在 互联 网 基础 
上 的 延伸 和 扩展 ,具有 技术 融合 度 高 .产业 链条 长 .应 用 领域 广 等 特点 ,一般 
包括 信息 的 采集 (“ 感 ”) ,传输 (* 传 ”) ,分 析 (* 知 ”)、 应 用 (* 用 ”) 等 多 个 环节 。 

(2) 云 计算 : 是 一 种 基于 互联 网 的 软 硬 件 服务 模式 , 旨 在 通过 最 小 的 管 
理 代价 和 可 配置 的 计算 资源 (如 服务 器 、 存 储 器 、 网 络 、 应 用 、 服 务 等 ) 为 用 户 
提供 快速 ,动态 易 扩 展 的 虚拟 化 资源 服务 。 用 户 只 需 有 简易 的 终端 设备 , 即 
可 使 用 浏览 器 进行 身份 验证 后 应 用 软 硬 件 服务 (桌面 系统 、 开 放 平 台 、 应 用 
系统 等 ) , 软 硬 件 及 数据 都 在 云 计算 中 心 。 云 计算 的 效率 和 低 成 本 服务 传递 
优势 从 技术 实现 层面 为 智慧 城市 的 数据 中 心 建设 提供 了 良好 的 解决 方案 。 

(3) 关联 数据 技术 是 一 个 语义 网 技术 的 最 佳 实践 , 它 采 用 资源 描述 框架 
(Resource Description Framework,RDF) 数 据 模型 ,采用 统一 资源 标识 符 
(Uniform Resource Identifier, URD) 命 名 并 生成 实例 数据 和 类 数据 ,在 网 络 
上 进行 发 布 和 部 署 后 能 通过 超 文本 传送 协议 (Hypertext Transfer Protocol， 
HTTP) 获 取 , 构 建 数据 互联 与 人 机 理解 的 语义 环境 。 

城市 计算 的 内 涵 在 于 将 城市 空间 中 的 每 个 传感器 .设备 .人 、 交 通 工具 、 
建筑 物 .道路 等 都 当 作 一 个 单元 去 感知 城市 动态 ,协同 完成 一 个 城市 级 别 的 


计算 以 服务 于 市 民 和 城市 。 城 市 数据 是 多 样 性 和 动态 性 的 。 例 如 以 城市 中 
的 出 租车 为 单元 ,可 以 基于 出 租车 速度 的 分 析 挖 掘 道路 上 的 交通 热点 ,基于 
出 租车 GPS 轨迹 数据 分 析 ,进行 两 地 间 的 通行 时 间 与 费用 预测 .最 优 路 径 选 
择 和 道路 规划 问题 评估 等 ;结合 城市 中 的 市 民 在 医疗 、 社 交 等 各 个 方面 的 行 
为 数据 ,通过 城市 计算 提供 流行 病 预 警 与 趋势 分 析 、 旅 游 推 荐 和 广告 投放 等 
服务 。 

城市 计算 旨 在 通过 城市 感知 数据 挖掘 、 智 能 提取 、 改 善 服务 四 个 环节 
形成 的 循环 过 程 来 智慧 型 地 提升 市 民生 活 和 城市 环境 ,以 及 通过 整合 交通 
流量 、 人 口 流动 .地 理 和 地 图 数据 、 环 境 、 能 源 消耗 、 人 口 总 数 和 经 济 状况 等 
一 系列 异 构 数 据 源 来 深度 分 析 突 发 现象 背后 的 本 质 和 科学 规律 。 

大 数据 与 智慧 城市 有 着 密 不 可 分 的 联系 。 作 为 城市 发 展 的 高 级 阶段 ， 
智慧 城市 创造 了 以 互联 互通 、 整 合共 享 , 协 同 联动 、 创 新 发 展 为 主要 特征 的 
城市 发 展 新 模式 ,大 数据 成 为 全 球 信息 化 的 重点 所 在 。 智 慧 城市 建设 带 来 
了 数据 量 的 爆发 式 增长 ,城市 中 密布 的 各 类 传感器 、 移 动 电 话 .GPS 设备 ,其 
至 城市 中 的 人 都 可 成 为 信息 的 源头 。 目 前 ,智慧 城市 建设 所 产生 的 数据 量 
已 超过 了 200PB, 而 大 数据 就 像 血液 一 样 遍布 智慧 交通 智慧 医疗 ,智慧 生活 
等 智慧 城市 建设 的 各 个 方面 ,城市 管理 正在 从 "经 验 治理 ”转向 “科学 治理 ”。 
智慧 城市 是 否 真 正 * 智 慧 ? 源 自 城市 大 数据 ,如 何 挖掘 海量 数据 的 潜在 价值 
并 为 城市 系统 的 运行 管理 决策 提供 支撑 ,是 智慧 城市 建设 的 关键 。 

城市 基础 运行 的 智能 化 程度 是 体现 一 个 城市 是 否 “智慧 "的 重要 指标 。 
本 书 内 容 中 将 多 次 提 及 城市 基础 运行 领域 ,并 以 此 为 例 进行 解构 分 析 。 城 
市 基础 运行 主要 指 城市 基础 设施 (如 道路 ,桥梁 、 矿 体 、 水 库 、 地 下 管 网 等 ) 及 
其 相关 城市 部 件 ( 如 车 辆 ) 的 运行 。 城 市 基础 运行 管理 的 主体 是 政府 部 门 ， 
服务 对 象 面向 城市 系统 中 的 政府 .企业 (社会 团体 ) 和 个 人 。 智 慧 城市 基础 
运行 管理 需要 对 城市 部 件 的 基础 状态 和 运行 状态 进行 实时 感知 和 控制 , 整 
合 城 市 基础 运行 相关 的 政务 信息 资源 和 社会 信息 资源 (包括 社会 公开 信息 
资源 及 政府 有 权限 提取 的 非 公开 信息 资源 ) ,实现 跨 领域 . 跨 部 门 、 跨 层级 、 
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跨 主 体 的 信息 共享 和 业务 协同 ,并 借助 数据 挖掘 .系统 仿真 .智能 检索 等 技 
术 手 段 ,为 城市 基础 运行 管理 和 决策 提供 有 效 支 撑 。 


123 新 一 代 信息 技术 助力 三 元 世界 融合 


1. 物 联 网 与 移动 终端 催生 城市 大 数据 需求 

大 数据 时 代 最 大 的 特征 不 在 于 数据 本 身 , 而 是 在 数据 的 源头 。 数 据 的 
主要 来 源 不 再 是 普通 的 PC 和 服务 器 ,而 是 被 物理 世界 不 断 创 造 出 来 ,并 被 
物理 世界 和 生活 在 物理 世界 中 的 人 所 接收 .处 理 和 利用 。 物 联网 产生 的 是 
物理 世界 的 感知 数据 ,移动 终端 产生 的 是 人 类 社会 的 应 用 类 数据 和 行为 类 
数据 。 随 着 物 联 网 与 移动 终端 的 普及 和 发 展 , 人 类 社会 与 物理 世界 日 益 紧 
密 相连 ,大 数据 在 这 个 过 程 中 应 运 而 生 。 

2 云端 的 选择 为 大 数据 决策 指引 新 的 航向 

云 计 算 和 云 存储 的 应 用 使 能 够 “理解 数据 .做 出 决策 "的 大 数据 技术 成 
为 现实 。 通 过 把 数据 存储 和 数据 分 析 变 成 可 以 更 加 方便 获得 的 网 络 服务 ， 
全 球 政府 .企业 和 个 人 使 用 、 消 费 信 息 技 术 的 模式 正在 改写 。 借助“ 云 " 的 伸 
缩 性 ,构建 云端 之 上 的 大 数据 平台 ,实现 大 数据 资源 的 “ 按 需 配置 ", 并 最 终 
获得 更 大 空间 的 决策 弹性 。 但 是 ,云端 的 大 数据 应 用 目前 仍然 存在 障碍 ,如 
美国 能 源 部 提出 的 数据 分 析 问 题 ,一 个 基于 云端 的 解决 方案 无 法 满足 对 EB 
量 级 的 数据 处 理 需 求 。 

3 三 元 世界 下 的 新 一 代 信 息 技术 趋向 融合 

在 复杂 性 科学 视野 下 ,科技 创新 必须 实现 技术 发 展 与 应 用 创新 的 并 驾 
齐 驱 。 中 国 科 学 院 战略 性 科技 先导 专项 “面向 感知 中 国 的 新 一 代 信 息 技术 
研究 ”中 指出 ,信息 化 水 平 是 当代 社会 生产 力 的 重要 标志 ,信息 化 的 终极 日 
标 是 利用 信息 技术 将 人 类 社会 与 信息 空间 、 物 理 世 界 相互 融合 ,形成 “人 机 
物 ” 三 元 一 体 的 世界 。 大 数据 与 物 联 网 、 云 计算 、 移 动 互 联网 等 新 一 代 信息 
技术 共同 构成 “人 机 物 ” 三 元 世界 融合 的 助 推 器 (参见 图 1. 4) 。 


图 1.4 “人 机 物 ” 三 元 体系 下 的 新 一 代 信 息 技术 


移动 终端 颠 颖 了 传统 的 社会 行为 和 关系 网 络 , 物 联网 融合 了 人 类 社会 
与 物理 社会 的 边界 , 云 彻底 改变 了 信息 服务 的 方式 ,而 大 数据 则 重 构 了 相关 
产业 和 领域 的 格局 。“ 人 机 物 ” 三 元 融合 体系 的 形成 是 城市 化 发 展 的 大 势 所 
趋 , 新 一 代 信 息 技 术 的 融合 则 是 这 次 变革 浪潮 的 核心 推动 力 。 


1.3 大 数据 决策 : 大 数据 时 代 的 大 变革 


人 \ 机 、 物 三 元 世界 的 高 度 融 合 引发 了 数据 规模 的 爆炸 式 增长 和 数据 模 
式 的 高 度 复杂 化 ,特别 是 Web 2. 0 传感器 .视频 监控 等 的 应 用 ,使 得 数据 量 
以 前 所 未 有 的 态势 迅猛 增长 ,世界 已 进入 网 络 化 的 大 数据 (Big Data) 时 代 。 
大 数据 带 给 世界 一 个 全 新 的 解决 问题 的 方法 ,将 成 为 引领 社会 变革 、 推 动 政 
府 职能 转型 .激发 企业 技术 创新 的 利器 。 在 这 个 技术 浪潮 到 来 之 际 , 如 何 应 
时 而 变 是 每 一 个 决策 主体 (组 织 或 者 个 人 ) 所 必须 认真 面 对 的 问题 。 
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131 大 数据 时 代 的 战略 诉求 


1. 大 数据 从 商业 行为 上 升 到 国家 战略 

大 数据 的 应 用 最 初 在 互联 网 技术 和 商业 模式 发 展 中 绒 露 头角 ,商业 活 
动 的 每 一 个 环节 都 建立 在 数据 收集 、 分 析 和 行动 的 能 力 之 上 。IDC 和 麦肯锡 
的 大 数据 研究 显示 ,大 数据 主要 在 四 个 方面 带 来 了 巨大 的 商业 价值 : 一 是 对 
顾客 群体 的 细 分 ;二 是 运用 大 数据 模拟 实 境 , 发 掘 新 的 需求 和 提高 投入 回报 
率 ; 三 是 提高 大 数据 成 果 在 各 部 门 间 的 分 享 程度 ,提高 企业 的 整体 管理 链条 
和 产业 链条 的 投入 回报 率 ; 四 是 进行 商业 模式 .产品 和 服务 的 创新 。 

2010 年 ,英国 卡 梅 伦 政府 提出 “数据 权 ”(Right to Data) 的 概念 ,将 其 作 
为 信息 时 代 向 全 社会 普及 的 公民 基本 权利 之 一 。 美 国 奥 巴 马 政府 提出 “ 开 
放 战 略 ”, 将 数据 开放 作为 政府 经济 和 社会 开放 的 根本 动力 。 这 些 概念 和 
行动 纲领 的 提出 ,标志 着 数据 的 定位 正在 逐渐 从 商业 领域 走 进 各 国政 府 的 
战略 核心 。 

2012 年 3 月 ,美国 政府 投资 2 亿美 元 启动 "大 数据 研究 和 发 展 计 划 ”, 通 
过 提高 从 大 型 复杂 的 数据 集中 提取 知识 和 观点 的 能 力 , 加 快 在 科学 与 工程 
中 前 进 的 步伐 ,加 强国 家 安全 ,推进 科学 发 现 和 创新 研究 。 这 个 计划 的 发 布 
正式 将 大 数据 技术 从 商业 行为 上 升 到 了 国家 战略 。 这 是 继 1993 年 美国 宣布 
“信息 高 速 公路 "计划 后 的 又 一 次 重大 科技 发 展 部 署 。 美国 政府 将 大 数据 比 
作 “ 未 来 的 新 石油 ”, 将 “大 数据 研究 ”首次 上 升 为 国家 意志 。 

联合 国 2012 年 在 纽约 总 部 发 布 了 一 份 大 数据 政务 白皮书 ,指出 大 数据 
时 代 已 经 到 来 ,希望 各 国 使 用 极 大 丰富 的 数据 资源 来 更 好 地 服务 和 保护 
AR. 

2013 年 ,英国 商业 、 创 新 和 技能 部 宣布 ,将 注资 1. 89 亿 英镑 研发 大 数据 
技术 ,将 在 基础 设施 方面 投入 巨 资 , 加 强 数据 采集 和 分 析 , 从 而 让 英国 在 “ 数 
据 革命 ”中 占 得 先 机 。2013 年 的 八国 峰会 (G8 Summit) ,签署 了 《八国 集团 


开放 数据 宪章 》(G8 Open Data Charter) ,明确 了 开放 数据 的 5 大 原则 和 14 
个 重点 开放 领域 ,其 主要 宗旨 是 推动 政府 更 好 地 向 公众 开放 数据 ,挖掘 政府 拥 
有 的 公共 数据 的 经 济 潜力 ,促进 经 济 增长 ,激发 创新 ,并 加 强 责 任 感 。 

2015 年 9 月 ,我国 国 务 院 正 式 发 布 (国务 院 关 于 印发 促进 大 数据 发 展 行 
动 纲要 的 通知 》( 国 发 C2015]50 号 ) ,成 为 我 国 促 进 大 数据 发 展 的 第 一 份 权威 
性 、 系 统 性 的 文件 。 该 文件 从 国家 大 数据 发 展 战略 全 局 的 高 度 ,提出 了 我 国 
大 数据 发 展 的 顶层 设计 ,是 指导 我 国 未 来 大 数据 发 展 的 纲领 性 文件 ,其 核心 
是 推动 各 部 门 、 各 地 区 、 各 行业 、 各 领域 的 数据 资源 共享 开放 。 中 国 和 美国 
政府 的 大 数据 战略 比较 详 见 本 书 附录 A。 

大 数据 带 来 了 深刻 的 社会 变革 ,能 够 显著 提升 政府 效率 、 透 明度 和 服务 
水 平 。 美 国 国家 安全 局 (NSA) 利 用 大 数据 分 析 来 对 抗 恐 怖 主义 活动 , 军 方 
利用 大 数据 搜查 到 拉登 的 蛛丝马迹 ,从 而 将 其 击毙。 政府 和 社会 数据 的 深 
度 利用 ,有 利于 透明 化 与 民主 监督 .增强 公民 参与 意识 ,推动 自我 赋 权 (self- 
empowerment) ,改进 政府 服务 效率 和 水 平 , 加 强 政 策 影响 力 评估 ,推动 产生 
新 知识 ,改进 或 创新 产品 和 服务 等 。 

大 数据 驱动 下 的 信息 产业 日 渐 成 为 关系 国民 经 济 和 社会 发 展 全 局 的 战 
略 性 .先导 性 产业 。 拥 有 数据 的 规模 和 质量 以 及 对 数据 的 控制 和 运用 能 力 ， 
将 直接 决定 一 个 国家 的 核心 竞争 力 。 大 数据 像 土地 ,石油 和 资本 一 样 成 为 
经 济 、 社 会 运行 中 的 根本 性 资源 ,国家 的 数据 主权 将 是 继 海 、 陆 、 空 、 天 、 网 之 
后 另 一 个 大 国 博弈 的 空间 。 

面 对 各 国政 府 纷纷 出 台 政 策 推动 大 数据 发 展 ,我 国 也 积极 应 对 ,在 多 个 
科技 项 目 中 进行 了 重点 支持 。 如 2011 年 “ 核 高 基 " 科 技 重大 专项 将 非 结 构 化 
数据 管理 作为 需要 突破 的 关键 技术 加 以 重点 支持 ;2012 年 12 月 国家 发 展 改 
革 委 员 会 将 “数据 分 析 软 件 开发 和 服务 ” 列 入 专项 指南 ;2013 年 大 数据 被 科 
技 部 列 和 人 “973 基础 研究 计划 ”和 国家 自然 科学 基金 指南 中 ;2014 年 ,科技 部 
启动 了 “大 数据 计算 ”重点 基础 研究 发 展 计 划 , 国 家 自然 科学 基金 委员 会 也 
启动 了 大 数据 重点 项 目 群 。 
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2 大 数据 从 数据 资产 转变 为 战略 资源 

相 比 传统 的 海量 数据 ,大 数据 从 TB 级 别 跃升 到 PB 其 至 EB 级 别 , 在 量 
级 上 有 了 更 大 的 提升 。 除 了 体 量 巨大 之 外 ,大 数据 还 具有 三 个 海量 数据 所 
不 具备 的 特点 : 第 一 ,数据 类 型 多 ,音频 视频. 图片 .GPS 等 各 类 数据 广泛 汇 
集 ;第 二 ,价值 密度 低 ,如 连续 不 间断 的 视频 监控 过 程 中 ,可 能 仅 有 几 秒 的 数 
据 是 有 价值 的 ;第 三 ,处 理 速度 快 ,这 与 传统 的 数据 挖掘 技术 有 着 本 质 的 
不 同 。 

人 类 从 工业 时 代 进 入 信息 时 代 的 一 个 显著 特征 , 即 数据 成 为 政府 企业 
和 个 人 的 重要 无 形 资产 ,与 固定 资产 共同 成 为 生产 过 程 中 的 基本 要 素 。 随 
着 大 数据 时 代 的 到 来 ,由 于 数据 量 级 的 指数 型 增长 及 其 本 身 草 含 的 巨大 挖 
掘 价值 ,大 数据 的 定位 已 不 仅仅 是 传统 意义 上 的 数据 资产 ,而 是 转变 为 与 自 
然 资 源 \ 人 力 资源 同等 重要 的 新 型 战略 资源 ,辐射 到 政治 .军事 . 社 会 .科技 、 
商业 .环境 等 各 个 领域 。 

大 数据 带 来 思维 方式 .商业 运作 和 管理 制度 等 多 方位 的 变革 ,涉及 政 
府 、 行 业 企业 和 个 人 ,是 现在 和 未 来 的 战略 制高点 。 人 类 第 一 次 有 机 会 和 条 
件 , 在 如 此 众多 的 领域 和 如 此 深入 的 层次 获得 和 使 用 全 面 数 据 、 完 整数 据 和 
系统 数据 ,深入 探索 现实 世界 的 规律 ,获取 过 去 不 可 能 获取 的 知识 ,得 到 过 
去 无 法 企及 的 商机 。 通 晓 如 何 利用 大 数据 的 国家 或 企业 将 具备 新 的 竞争 优 
势 ,重新 划 定 竞争 版 图 。 

3 大 数据 从 智能 分 析 延 仲 到 科学 决策 

随 着 新 一 代 信息 技术 的 兴起 , 物 联 网 .移动 终端 社交 网 络 、GIS 等 的 广 
泛 应 用 为 大 数据 提供 了 丰富 的 数据 来 源 。 数 据 中 包含 着 每 个 用 户 的 身份 、 
地 点 .时 间 、 喜 好 .厌恶 .行为 .社会 关系 等 大 量 直 接 或 潜在 的 信息 。 随 着 数 
据 挖掘 技术 的 发 展 ,面向 大 数据 的 智能 化 分 析 不 可 避免 地 成 为 了 科技 界 和 
企业 界 共同 关注 的 前 沿 热点 。 

在 思维 方式 上 ,数据 的 丰富 及 易 得 将 改变 人 类 认识 世界 的 方式 。 


(1) 从 样本 式 推 导 走 向 全 数据 审视 。 过 去 的 科学 家 、 社 会 学 家 、 经 济 学 
家 .企业 家 等 由 于 技术 和 资源 的 限制 ,只 能 通过 采样 调研 和 统计 分 析 等 手段 
了 解 关注 的 对 象 ,而 如 今 数据 的 采集 和 存储 成 本 已 经 很 低 , 完 全 可 以 通过 全 
部 数据 进行 分 析 ,不 存在 样本 抽样 的 概念 。 大 数据 已 成 为 继 实验 归纳 、 模 型 
推演 和 计算 机 模拟 等 范式 之 后 的 第 四 科研 范式 了 。 

(2) 从 精确 性 走向 混杂 性 。 大 量 数据 的 应 用 还 具有 充分 的 容错 性 ,过 去 
采样 的 数据 如 果 出 现 失误 可 能 导致 统计 结果 偏离 严重 ,而 采用 全 部 的 数据 
则 会 将 有 瑕 钼 的 若干 数据 淡化 处 理 。 

(3) 相关 关系 成 为 因果 关系 的 有 效 补 充 。 数 据 分 析 不 再 局 限于 验证 已 
有 的 推测 是 否 正确 ,而 是 努力 寻找 背后 的 因果 关系 。 在 很 多 情况 下 ,只 需要 
知道 是 什么 ”就 能 做 出 决策 ,而 不 需要 对 “为 什么 "投入 大 量 人 力 、 物 力 进行 

大 数据 将 产生 新 知识 ,促进 创新 ,推动 传统 产业 转型 发 展 ,催生 全 新 产 
业 , 产 生 巨 大 的 经 济 价值 , 成 为 产业 升级 与 经 济 转型 的 创新 要 素 。 数 据 的 重 
新 组 合 将 会 创造 新 的 知识 和 思想 ,甚至 创造 全 新 的 领域 。 比 如 在 19 世纪 , 研 
究 人 员 通 过 将 黑 死 病死 亡 率 和 饮用 水 井 的 地 理 分 布 联系 起 来 ,发 现 了 饮用 
水 污染 和 黑 死 病 之 间 的 关系 ,从 而 推动 伦敦 建造 了 全 新 的 排污 系统 ,大 幅度 
改善 了 公众 卫生 状况 。 

通过 大 数据 的 重新 组 合 和 深入 应 用 ,人 们 可 以 期 待 发 现 更 多 类 似 的 新 
知识 。 据 麦肯锡 统计 ( 见 图 1. 5) ,大 数据 能 为 美国 医疗 服务 业 每 年 带 来 大 约 
3000 亿美 元 的 商业 价值 ;能 为 欧洲 的 公共 管理 每 年 带 来 2500 亿 欧 元 的 价 
值 , 能 帮助 美国 零售 业 提 升 60% 的 净利 润 ,并 帮助 降低 美国 制造 业 50% 的 产 
品 开发 ,组装 成 本 。 美 国 通用 电气 公司 通过 每 秒 分 析 上 万 个 数据 点 ,融合 能 


OD 范式 (paradigm) 的 概念 和 理论 由 美国 著名 科学 哲学 家 托马斯 。 库 思 (Thomas Kuhn) 提 出 并 
在 《科学 革命 的 结构 》(The Structure of Scientific Revolutions)(1962) 中 系统 阐述 , 指 的 是 一 个 共同 
体 成 员 所 共享 的 信仰 、 价 值 .技术 等 的 集合 。 它 是 常规 科学 所 赖 以 运作 的 理论 基础 和 实践 规范 ,是 从 
事 某 一 科学 的 研究 者 群体 所 共同 遵从 的 世界 观 和 行为 方式 。 
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量 储存 和 先进 的 预测 算法 ,开发 新 型 风机 ,效率 与 电力 输出 分 别 比 现行 风机 
He S 25% M15%. Gartner 预测 ,大 数据 将 为 全 球 带 来 440 万 个 IT 岗位 ， 
1300 多 万 个 非 IT 岗位 。 数 据 使 用 率 提升 10% 对 行业 人 均 产 出 的 平均 提升 
幅度 如 图 1.6 所 示 。 


Yi 


美国 医疗 服务 业 欧洲 公共 管理 部 门 全 球 个 人 定位 数据 

+ 每 年 价值 3000 亿 美元 。 每 年 价值 2500 亿 欧元 = 服务 器 提供 商 营 收 每 年 将 新 增 

。 约 0.7 个 百分点 的 年 生产率 增长 | | 。 约 05 个 百分点 的 年 生产 率 增长 | | “1000 人 美元 

+ SHR a 70001. 
元 的 


美国 零售 业 制造 业 
© Ws 生 :60% 以 上- < ||。 产品 研发 和 装配 成 本 最 高 将 
个 百分点 的 年 生 50% 


下 降 5096 
。 运营 资本 最 高 将 消减 7 个 百分点 


图 1.5 大 数据 将 在 各 个 行业 产生 显著 的 经 济 价值 
(资料 来 源 : 麦肯锡 ) 


60% 
50% 
40% 
30% 
20% 
10% 

0% 


49% 
39% 


21% 20% 20% 20% 19% 18% 18% 17% 


ty 
Pe 
Sy L 

7 

Ty 


十 SS” 
SES ey 


图 1.6 数据 使 用 率 提 升 10% 对 行业 人 均 产 出 的 平均 提升 幅度 
(资料 来 源 : 美国 得 克 萨 斯 大 学 Measuring the Business Impacts of Ef fective Data) 


大 数据 深刻 影响 着 每 一 个 人 ,更 好 地 使 用 大 数据 可 以 帮助 个 人 降低 信 


息 获 取 成 本 ,在 生活 中 做 出 更 好 的 决策 ,增加 社会 活跃 度 ,提升 生活 质量 


如 美国 政府 数据 门户 网 站 (Data. gov) #2 HE 50 多 类 数据 以 及 处 理 这 些 数据 所 
需 的 软件 工具 ,所 有 人 都 可 以 自由 下 载 使 用 。 该 网 站 的 数据 资料 不 仅 有 利 
于 公众 了 解 政 府 政策 ,也 对 居民 的 日 常生 活 提 供 了 实在 的 帮助 ;丹麦 一 位 女 
士 利用 公共 数据 开发 的 网 站 findtoilet. dk, 可 以 显示 全 丹麦 公共 厕所 的 信 
息 ,来 帮助 她 所 认识 的 有 膀胱 问题 而 不 敢 出 门 的 人 士 放心 外 出 ;Zillow 可 以 
帮助 用 户 在 大 量 数据 分 析 的 基础 上 ,做 出 购房 以 及 居住 地 域 的 选择 ,类 似 的 
公司 还 有 Ttulia, Estately, Redfin 等 。 

大 数据 从 最 初 的 概念 和 理念 演变 到 今天 成 为 各 国政 府 的 行动 纲领 和 资 
本 市 场 的 投资 方向 ,单纯 对 大 数据 本 身 的 智能 分 析 已 不 足以 满足 政府 和 企 
业 应 对 技术 模式 创新 .产业 垂直 整合 和 业务 深度 融合 的 需求 。 面 对 低 延 迟 、 
细 粒 度 .多 样 化 的 数据 源 , 如 何 实现 复杂 数据 的 信息 协同 和 科学 决策 的 智慧 
支撑 成 为 新 的 时 代 命 题 。 
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1.32 大 数据 分 析 的 关键 技术 


随 着 智慧 城市 发 展 的 需求 变革 ,大 数据 将 最 终 服务 于 政府 ,企业 和 科研 bl 

机 构 的 科学 决策 ,这 就 从 信息 对 称 和 快速 反应 的 角度 对 大 数据 本 身 的 技术 

体系 提出 了 挑战 。 在 海量 数据 的 技术 基础 上 ,大 数据 由 于 其 自身 的 固有 特 

征 ,在 非 结构 化 数据 的 海量 存储 与 实时 处 理 、 多 数据 源 的 整合 与 集成 多 维 

尺度 分 析 \ 可 视 化 分 析 、 数 据 质量 .安全 与 隐私 保护 等 五 个 方面 面临 更 大 的 

挑战 。 除 此 之 外 ,大 数据 还 带 来 了 一 些 其 他 的 技术 挑战 ,如 大 数据 的 新 型 表 

示 方 法 ,大 数据 的 去 完 降 品 技术 .高 效率 低 成 本 的 大 数据 存储 .适合 不 同行 

业 的 大 数据 控 气 分 析 工 具 和 开发 环境 .大 幅度 降低 数据 处 理 、 存 储 和 通信 能 

耗 的 新 技术 等 。 a 
信息 技术 的 发 展 经 历 了 从 硬件 到 软件 再 到 服务 的 变迁 。 大 数据 的 本 质 = 

实际 上 是 通过 新 一 代 信息 化 技术 从 各 种 各 样 的 终端 理解 数据 ,快速 整合 , 控 = 

掘 价值 ,并 最 终 做 出 决策 。 — 
大 数据 的 4V 特征 对 涉及 产生 ,管理 .整合 .分 析 、 价 值 提取 生命 周期 各 ” 19 
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个 环节 的 传统 技术 都 带 来 了 巨大 的 挑战 。 当 前 关注 的 大 数据 关键 技术 主要 
涉及 海量 分 布 式 文件 系统 、 并 行 计 算 框 架 、 非 关系 型 数据 库 (NoSQL)、 实 时 
流 数 据 处 理 、 内 存 计 算 及 智能 分 析 技 术 , 如 模式 识别 、 自 然 语言 理解 .应 用 知 
识 库 等 。 大 数据 分 析 的 基础 技术 如 图 1.7 所 示 。 

1. 开 源 软 件 受 到 广泛 欢迎 

开源 项 目 和 产品 正在 主导 新 兴 的 大 数据 市 场 。 分 布 式 处 理 的 软件 框架 
Hadoop、 用 来 进行 数据 挖掘 和 可 视 化 的 软件 环境 R、 非 关系 型 数据 库 
HBase、MongoDB 和 CouchDB 等 开源 软件 都 在 大 数据 技术 领域 占据 重要 地 
位 。2012 年 排名 前 5 位 的 数据 挖掘 工具 中 ,有 4 个 是 开源 软件 。 

2 人 工 智 能 技术 不 断 融 入 


大 数据 可 以 看 作 是 对 大 规模 数据 集合 的 智能 分 析 处 理 。 大 数据 之 所 以 
受到 重视 ,是 因为 它 能 够 帮助 人 们 从 似乎 无 穷 多 的 数据 中 发 现 信息 、 发 现 规 
则 ,发 现 知识 ,发掘 智慧 ,进而 对 未 来 的 发 展 态势 做 出 预测 。 要 想 对 大 数据 
做 出 这 样 的 智能 处 理 ,就 必须 要 用 到 人 工 智 能 技术 ,大 数据 的 管理 分析 和 
可 视 化 等 技术 无 不 与 人 工 智 能 相关 联 , 目 前 机 器 学 习 、 数 据 挖掘 、 自 然 语言 
理解 .模式 识别 等 人 工 智能 技术 已 经 深 深 融入 到 大 数据 各 流程 的 处 理 技 术 
Zz. 

3. 非 结 构 化 数据 处 理 技术 受到 重视 

云 计算 时 代 的 到 来 使 得 数据 创造 的 主体 由 企业 逐渐 转向 个 体 ,而 个 体 
所 产生 的 绝 大 部 分 数据 为 图 片 文档、 视频 等 非 结 构 化 数据 。 信 息 化 技术 的 
普及 使 得 企业 更 多 的 办 公 流 程 通过 网 络 得 以 实现 ,由 此 产生 的 数据 也 以 非 
结构 化 数据 为 主 。 因 此 ,对 非 结 构 化 数据 的 处 理 需求 越 来 越 强烈 , 非 结构 化 
处 理 技 术 越 来 越 受 到 重视 , 非 结构 化 数据 采集 技术 、NoSQL 数据 库 、 流 处 理 
技术 正在 快速 发 展 。 

4 分布 式 处 理 架 构成 为 大 数据 处 理 的 普遍 模式 

由 于 大 数据 要 处 理 大 规模 海量. 异 构 的 数据 ,传统 的 处 理 方法 在 存储 
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空间 、 处 理 时 间 和 效率 上 都 难以 满足 人 们 对 大 数据 处 理 的 要 求 ,所 以 在 各 个 
处 理 环节 中 都 普遍 采用 分 布 式 方法 进行 并 行 处 理 。 此 外 ,由 于 云 计算 技术 
的 发 展 ,利用 云 计算 技术 处 理 大 数据 问题 成 为 人 们 广泛 采用 的 方法 ,而 云 计 
算 技 术 也 是 以 分 布 式 处 理 为 核心 的 。 目 前 , MapReduce 等 分 布 式 处 理 方式 
已 经 成 为 大 数据 处 理 各 环节 的 通用 处 理 方法 ,分 布 式 文件 系统 、 大 规模 并 行 
处 理 数据 库 、 分 布 式 编程 环境 等 技术 也 普遍 被 使 用 。 

数据 分 析 是 大 数据 决策 的 核心 。 大 数据 的 价值 体现 在 对 大 规模 数据 集 
合 的 智能 处 理 , 从 而 可 在 无 穷 多 的 数据 中 发 现 信息 、 知 识 和 智慧 。 要 想 实 现 
这 样 的 价值 ,最 关键 的 步骤 就 是 对 数据 的 分 析 和 挖掘 。 数 据 的 采集 .存储 和 
管理 都 是 数据 分 析 步 又 的 基础 ,数据 分 析 得 到 的 智能 结果 可 以 应 用 到 大 数 
据 相 关 的 各 个 领域 。 大 数据 将 充分 利用 机 器 学 习 、 数 据 挖掘 模式 识别 、 自 
然 语言 理解 等 人 工 智 能 基础 技术 ,进一步 实现 数据 分 析 的 智能 化 。 

2013 年 11 月 ,初创 企业 Vicarious 开发 出 一 种 算法 ,可 击败 文字 型 的 
CAPTCHA9。 其 中 ,被 认为 难度 最 高 的 Google 的 reCAPTCHA 测试 其 识 
别 率 达 90% ,而 在 Yahoo, Paypal 及 CAPTCHA. com 的 表现 甚至 更 好 ,说 明 
数据 分 析 技 术 又 迈 出 了 重要 一 步 。 

能 够 对 自然 语言 处 理 和 图 像 识别 等 前 沿 领域 提供 支持 的 深度 学 习 技 术 
是 大 数据 下 最 热门 的 趋势 之 一 。Gigaom. com 网 站 整理 了 一 个 指南 : 深度 
学 习 领 域 的 快速 发 展 ,鼓舞 着 越 来 越 多 的 在 自然 语言 处 理 和 图 像 识 别 等 领 
域 的 初创 企业 去 研究 它 。 同 时 ,包括 Google, Mk, Facebook 和 雅虎 在 内 的 
科技 巨头 ,在 深度 学 习 方面 的 投入 也 在 提高 。 有 不 少 高 校 的 研究 机 构 也 在 
该 领域 进行 前 沿 技术 的 研究 。 深 入 学 习 技术 的 主要 参与 者 如 表 1. 1 所 示 。 


®© Completely Automated Public Turing Test to Tell Computers and Humans Apart (全 自动 区 
分 计算 机 和 人 类 的 图 灵 测 试 ,CAPTCHA): 很 多 网 站 和 应 用 都 使 用 CAPTCHA 来 验证 另 一 端的 登 
录用 户 是 否 是 人 类 。 从 理论 上 来 说 ,CAPTCHA 可 拥有 多 种 形式 ,但 是 扭曲 文字 图 片 形式 被 证 明 是 
阻止 恶意 软件 机 器 人 程序 及 SPAM 的 有 效 方式 。 这 是 因为 当 文 字 以 扭曲 、 重 又 或 被 随机 线 、 点 及 颜 
色 和 遮盖 的 图 片 形 式 出 现时 软件 很 难 破译 ;而 人 类 这 方面 却 能 力 超 强 ,往往 只 需要 看 几 眼 就 能 识别 出 
各 种 变化 形式 的 文字 。 


类 型 


公 司 


表 1.1 


关注 领域 


深度 学 习 技 术 的 主要 参与 者 


主要 进展 


AlchemyAPI 


文本 分 析 及 
图 像 识 别 


通过 API 提供 服务 。 许 多 公司 通过 它 提供 的 服务 ， 
提取 关键 词 进 行情 感 分 析 、 内 容 分 类 和 标记 


Cortica 


图 像 识别 


仿照 人 类 在 识别 图 像 时 大 脑 皮质 中 神经 网 络 的 图 像 
处 理 的 方式 ,产品 出 售 给 出 版 商 和 广告 商 , 用 以 展示 
与 页 面 图 片 内 容 相关 的 广告 内 容 


Ersatz 


图 像 识别 和 
情感 分 析 


为 深度 学 习 设 计 了 类 似 亚马逊 云 计算 的 平台 产品 ， 
提供 给 用 户 网 页 交互 界面 \.API、 基 于 云端 资源 的 
GPU 和 神经 网 络 的 实现 .能 够 让 用 户 以 需要 的 方 
式 ,组 建 和 运行 模型 


Semantria 


通过 API 和 Excel 插件 实现 功能 ,通过 整合 更 多 深 
度 学 习 的 方法 和 扩展 除 维基 百科 (Lexalytics 引擎 获 
取 语 义 知 识 的 地 方 ) 之 外 的 数据 源 ,来 提高 服务 的 
精度 


科技 
巨头 


Facebook 


希望 深入 学 习 可 更 好 地 优化 News Feed 的 功能 ,并 
实现 更 畅快 的 照片 共享 体验 。Facebook 对 于 深入 
学 习 领 域 最 大 的 贡献 可 能 是 它 数量 众多 的 基础 设施 
和 开源 的 专业 硬件 


Google 


文本 、 图 片 、 


语音 


Google 是 深入 学 习 领 域 中 最 著名 的 公司 ,这 要 归功 
于 它 高 度 公 开 的 图 像 识别 领域 的 研究 (这 个 模型 不 
需要 训练 ,就 能 够 识别 猫 脸 和 人 脸 )。 最 近 它 又 决定 
开源 一 些 文本 分 析 的 新 工具 。 深 度 学 习 已 经 支持 
Andriod 手机 上 的 语音 识别 ,还 能 直接 在 Google 十 
上 搜索 图 片 , 即 便 这 些 图 片 没有 任何 标签 


科技 
巨头 


IBM 


Watson 系统 在 智力 竞赛 节目 (危险 边缘 》 中 ,击败 了 
所 有 对 手 获得 冠军 。 现 在 ,这 个 技术 被 应 用 到 医疗 
保健 等 领域 , 它 整合 了 大 量 的 数据 分 析 技 术 ,其 中 就 
包含 深度 学 习 。 之 外 ,IBM 还 围绕 “ 认 知 计算 "做 了 
大 量 的 工作 。IBM 联合 四 所 高 校 进 行 科研 合作 ,并 
把 深度 学 习作 为 其 中 的 一 个 核心 


微软 


文本 、 图 片 、 


ae 
Gi 


微软 研究 院 对 大 数据 进行 了 多 年 的 研究 。 其 研究 人 
员 想 方 设法 从 网 络 和 移动 应 用 收集 各 种 数据 ,并 希 
望 深入 学 习 能 在 网 页 ,移动 .游戏 ,甚至 商业 软件 平 
台 等 方面 提供 更 加 富有 魅力 的 体验 ,而 这 背后 最 大 
的 王牌 可 能 是 Kinect 技术 
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续 表 


类 型 a a 关注 领域 主要 进展 
雅虎 没有 像 Google 和 微软 那样 引 人 注 目 ,但 它 分 别 
科技 收购 了 两 家 基于 深度 学 习 的 图 像 识 别 公 司 IQ 
Ed 雅虎 图 像 识 别 Engines 和 LookFlow。 和 雅虎 目前 的 重心 是 让 Flickr 
变 得 更 具 吸 引力 ,使 其 在 移动 端的 设置 更 加 简单 、 
智能 
多 伦 多 大 学 在 深度 学 习 领域 有 许多 重大 的 突破 ,2013 年 创建 的 
研究 小 组 DNNresearch 已 被 Google 收购 
斯 坦 福 大 学 斯 坦 福 大 学 的 研究 侧重 于 对 整个 句子 的 理解 ,而 不 是 
pee :| 语义 分 析 单个 单词 。 目 前 ,对 于 分 析 电影 评论 情感 分 析 的 准确 
i 率 已 经 达到 85% 
研究 | 纽约 大 学 研 | a pepo aii wpe 
机 构 | 究 小 组 图 像 识 别 研究 让 计算 神经 网 络 更 加 简单 
蒙特 利 尔 研 蒙特 利 尔 大 学 的 LIST 实验 室 创造 了 开源 数据 库 
究 小 组 e Theano。 它 能 使 得 复杂 的 程序 设计 语言 Python 4 
得 更 加 简单 ,同时 可 让 这 种 语言 在 GPU 上 运行 
瑞士 研究 1991 年 就 开始 研究 深度 学 习 。 该 团队 已 经 赢得 了 
小 组 无 数 深度 学 习 领域 的 竞赛 


除 此 之 外 ,大 数据 还 带 来 了 一 些 其 他 的 技术 挑战 ,如 大 数据 的 新 型 表示 
方法 、 大 数据 的 可 视 化 分 析 、 大 数据 的 去 元 降 噪 技术、 高 效率 低 成 本 的 大 数 
据 存储 、 适 合 不 同行 业 的 大 数据 挖掘 分 析 工 具 和 开发 环境 以 及 大 幅度 降低 
数据 处 理 、 存 储 和 通信 能 耗 的 新 技术 等 。 


133 大 数据 的 安全 和 隐私 保护 


大 数据 对 数据 的 完整 性 和 可 用 性 带 来 了 挑战 ,但 在 防止 数据 丢失 、 被 窃 
取 和 被 破坏 上 存在 一 定 的 技术 难度 ,传统 的 安全 工具 不 再 像 以 前 那么 有 效 ， 
而 且 大 数据 技术 也 可 能 成 为 黑客 的 攻击 手段 和 载体 。 

1. 大 数据 使 个 人 隐私 保护 更 为 困难 

20 世纪 90 年 代 , 可 以 通过 “性 别 十 邮编 十 出 生年 月 日 ”识别 出 87% 的 美 
国人 ,只 要 保护 好 这 些 个 人 信息 就 能 很 好 地 保护 隐私 。 但 在 今天 ,通过 分 析 


用 户 4 个 曾经 到 过 的 位 置 点 就 可 以 识别 95% 的 用 户 , 分 析 Facebook 的 like 
按钮 就 能 获得 大 量 用 户 个 人 信息 ,如 种 族 (准确 率 95%) 性别 (93%)、 性 取 
向 (88%) .单身 状况 (67%) 等 ,这 使 得 保护 个 人 隐私 更 为 困难 。 

2 国家 安全 面临 更 大 威胁 

2013 年 5 月底 , 随 着 "斯 诺 登 事件 ”爆料 棱镜 (Prism) 计 划 , 美 国 国家 安 
全 局 (NSA) 秘 密 对 其 国内 公民 和 其 他 国家 的 大 规模 数据 收集 和 监控 行为 浮 
出 水 面 ,谷歌 微软 等 6 家 互联 网 企业 和 运营 商 为 其 提供 了 数据 支持 。 其 中 ， 
无 界 告密 者 (Boundless Informant) 项 目 在 2013 年 2 月 至 3 月 的 短 短 30 天 
内 ,就 从 全 世界 互联 网 上 收集 到 970 亿 条 数据 。 据 美国 媒体 披露 ,NSA 还 有 
一 个 名 为 定制 人 口 组 织 (Tailored Access Operations) 的 秘密 机 构 , 有 超过 
1000 名 军队 及 民间 专家 ,该 组 织 每 小 时 可 获取 2PB 数据 并 可 自动 处 理 。 英 
国 也 有 类 似 的 大 数据 监控 行动 ,并 与 美国 共享 情报 。 中 国 大 陆 是 美国 监控 
的 重点 对 象 。 据 斯 诺 登 称 ,在 过 去 15 年 时 间 里 .定制 入 口 组 织 已 渗透 到 中 国 
计算 机 及 电信 系统 ,获得 了 有 关中 国 “最 好 的 、 最 可 靠 的 情报 ”。 

3. 数据 安全 的 风险 更 加 西 显 

随 着 大 数据 海量 数据 存储 和 信息 分 析 荣 取 手 段 的 进步 , 必 将 加 大 信息 
的 开放 度 , 带 来 的 副作用 是 IT 基础 架构 将 变 得 越 来 越 一 体 化 和 外 向 型 ,这 
就 对 数据 安全 和 知识 产权 构成 了 更 大 的 风险 。 同 时 ,由 于 大 数据 拓宽 了 对 
个 人 信息 获取 的 渠道 ,引发 了 用 户 隐 私 性 与 信息 利用 便利 性 之 间 的 冲突 。 
在 大 数据 时 代 ,不 论 告知 与 许可 ,还 是 匿名 (隐身 )、 模 糊 化 ,这 三 大 传统 的 用 
户 隐私 保护 策略 都 将 失效 。 消 费 者 虽然 可 以 受 惠 于 海量 数据 挖掘 带 来 的 更 
符合 消费 需要 和 更 低 价格 的 商品 ,但 也 随 着 个 人 购买 偏好 、 健 康 、 财 务 情况 
等 数据 被 收集 ,增加 了 对 隐私 安全 的 担忧 。 因 此 ,必须 采取 应 用 和 管理 同 
步 、 开 放 和 管控 并 重 的 方法 ,在 促进 大 数据 时 代 市 场 良 性 竞争 的 同时 ,切实 
保护 数据 安全 。 

随 着 数量 越 来 越 多 的 数据 被 数字 化 ,跨越 组 织 边 界 而 流动 着 ,一 系列 政 
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策 问题 将 会 变 得 越 来 越 重要 ,这 包括 但 不 限于 隐私 、 安 全 ,知识 产权 和 责任 。 
显然 , 随 着 海量 数据 的 价值 愈加 明显 ,隐私 是 个 重要 等 级 (尤其 是 对 消费 者 
来 说 ) 不 断 提高 的 问题 。 个 人 数据 (例如 健康 和 财务 记录 ) 经 常 能 够 提供 最 
重要 的 人 类 福利 ,例如 ,帮助 精准 确定 适当 的 医疗 或 者 最 恰当 的 金融 产品 。 
然而 ,消费 者 也 将 这 些 类 别 的 数据 视 为 最 敏感 的 个 人 隐私 。 显 然 , 个 人 和 其 
生活 所 在 的 社会 将 不 得 不 努力 在 数据 隐私 和 数据 的 功用 之 间 权衡 取舍 。 

海量 数据 日 益 提升 的 经 济 意义 也 昭示 了 一 系列 法 律 问题 , 尤 其 是 当 其 
与 如 下 事实 联系 起 来 时 : 即 数据 与 许多 其 他 资产 具有 根本 性 的 差异 。 数 据 
可 以 与 其 他 数据 结合 起 来 完美 而 轻松 地 复制 ,同样 一 份 数 据 可 以 由 多 个 人 
同时 使 用 。 这 些 是 数据 与 实体 资产 相 比 的 独 有 特征 。 有 关 数 据 所 附带 的 知 
识 产权 的 问题 不 容 回避 : 何人 “拥有 ” 某 份 数据 ? 某 一 数据 集 附带 着 何 种 权 
利 ? 数据 的 “公平 使 用 ”的 定义 是 什么 ? 此 外 ,还 有 与 责任 相关 的 问题 当 一 
份 不 准确 的 数据 导致 负面 结果 时 谁 应 负责 ? 要 充分 发 挥 海量 数据 的 潜力 ， 
此 类 法 律 问题 需要 泪 清 ,也 许 会 随 着 时 间 的 推移 逐步 泪 清 。 

4 大 数据 跨 境 流动 问题 更 加 频繁 

跨 境 数 据 服务 折射 出 隐私 安全 。2011 年 ,两 位 美国 技术 人 员 发 现 
iPhone 会 在 隐蔽 的 情况 下 持续 收集 用 户 位 置信 息 并 且 保 存 。《 华 尔 街 日 报 》 
调查 后 发 现 ,即便 用 户 关闭 手机 的 定位 功能 ,也 不 能 阻止 这 种 情况 发 生 。 多 
数 用 户 在 使 用 手机 应 用 商店 服务 时 ,都 会 “同意 ”所 谓 的 隐私 协定 ,但 他 们 并 
不 清楚 这 个 简单 的 行为 意味 着 什么 。 这 些 应 用 商店 和 软件 开发 者 会 利用 这 
些 资料 去 做 用 户 完 全 不 知道 的 事情 。 无 论 用 何 种 方式 登录 互联 网 ,许多 隐 
藏 在 背后 的 机 构 和 个 人 可 以 瞬间 知道 你 是 谁 ,来 自 哪 里 .收入 高 低 、. 品 牌 嘉 
好 ,甚至 一 周 内 的 消费 计划 。 而 孤立 的 用 户 永 远 不 会 想到 ,这 些 信息 就 是 通 
过 iPhone 的 一 次 不 经 意 下 载 , 搜 索 . 导 航 \ 点 评 被 掌握 的 。 

目前 ,我 国 对 大 数据 的 安全 保护 能 力 还 十 分 有 限 。 当 前 ,发达 国 家 已 经 
借助 大 数据 发 展 逐 步 掌握 窃取 、 挖 掘 别 国 信息 的 能 力 “ 棱 镜 门 ? 事 件 就 是 这 


一 现象 的 集中 反映 。 我 国 对 大 数据 的 保护 能 力 还 十 分 有 限 ,数据 被 恶意 使 
用 的 现象 难以 掌控 。2012 年 中 国 的 数据 存储 量 是 364EB, 其 中 55% 
(200EB) 的 数据 需要 一 定 程 度 的 保护 ,然而 只 有 96EB 的 数据 得 到 保护 ;个 
人 和 企业 的 数据 资源 保护 意识 比较 单薄 ,如 CSDN 600 万 个 人 注册 信息 汇 
露 ,中 国人 寿 80 万 保单 个 人 信息 泄露 。 


134 大 数据 决策 的 应 用 案例 


目前 ,大 数据 决策 正在 向 更 多 的 行业 和 应 用 场景 拓展 。 在 行业 方面 ,大 
数据 决策 已 经 从 电子 商务 .互联 网 ,快速 消费 品 等 行业 向 金融 ,政府 .公共 事 
业 \ 能 源 、 交 通 等 行业 扩展 ;从 应 用 场景 来 看 ,也 从 结构 化 数据 的 分 析 发 展 到 
半 结 构 化 、 非 结构 化 数据 的 分 析 , 尤 其 是 社交 媒体 信息 分 析 受 到 用 户 的 更 多 

1. 谷歌 

大 数据 决策 最 著名 的 案例 当 属 2009 年 甲 型 HIN1 流感 爆发 几 周 前 , 互 
联网 巨头 谷歌 公司 的 工程 师 们 在 (自然 ) 杂 志 上 发 表 了 一 篇 引 人 注 目的 论 
文 。 它 令 公共 卫生 官员 们 和 计算 机 科学 家 们 感到 震惊 。 文 中 表示 , 和 疾 控 
中 心 一 样 ,谷歌 也 能 判断 出 流感 是 从 哪里 传播 出 来 的 ,而 且 其 判断 非常 及 
时 ,不 会 像 疾 控 中 心 一 样 要 在 流感 爆发 一 两 周 之 后 才 可 以 做 到 。 谷 歌 公 司 
发 现 能 够 通过 人 们 在 网 上 检索 的 词 条 辨别 出 其 是 否 感染 了 流感 后 ,把 5000 
万 条 美国 人 最 频繁 检索 的 词 条 和 美国 疾 控 中 心 在 2003—2008 年 间 季节 性 流 
感 传 播 时 期 的 数据 进行 了 比较 。 通 过 一 个 数学 模型 处 理 后 ,其 预测 与 官方 
数据 的 相关 性 高 达 97%。 所 以 ,2009 年 甲 型 HINI 流感 爆发 的 时 候 ,与 习 
惯性 沾 后 的 官方 数据 相 比 ,谷歌 成 了 更 有 效 、 更 及 时 的 指示 标 ,公共 卫生 机 
构 的 官员 获得 了 非常 有 价值 的 数据 信息 。 

2 零售 行业 

诸如 沃尔玛 ,Tesco( 英 国 零售 巨头 ) 等 巨头 已 从 数据 中 获得 了 巨大 的 利 
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益 , 也 因此 巩固 了 自己 在 业界 的 长 盛 不 衰 。 以 曾经 因 “ 少 女 怀 孕 事件 ”而 成 
为 大 数据 典型 案例 的 Tesco 公司 为 例 ,这 家 全 球 利润 第 二 大 的 零售 商 从 其 
会 员 卡 的 用 户 购 买 记录 中 ,可 充分 了 解 一 个 用 户 是 什么 "类别 ”的 客人 ,如 速 
食 者 单身、 有 上 学 孩子 的 家 庭 等 ,并 可 基于 这 些 分 类 进行 一 系列 业务 活动 。 
比如 ,通过 邮件 或 信件 寄 给 用 户 的 促销 可 以 变 得 十 分 个 性 化 ,店内 的 上 架 商 
品 及 促销 也 可 以 根据 周围 人 群 的 喜好 、 消 费 的 时 段 使 其 更 加 有 针对 性 ,从 而 
提高 货品 的 流通 。 这 样 的 做 法 为 Tesco 获得 了 丰厚 的 回报 , 仅 在 市 场 宣传 
一 项 ,就 能 帮助 Tesco 每 年 节省 3. 5 亿 英 镑 的 费用 。 

3 能源 行业 

SaaS 型 软件 公司 Opower 使 用 数据 来 提高 消费 用 电 的 能 效 ,并 取得 了 
显著 的 成 功 。Opower 与 多 家 电力 公司 合作 ,分 析 美 国家 庭 的 用 电费 用 并 将 
其 与 周围 邻居 的 用 电 情 况 进行 对 比 ,被 服务 的 家 庭 每 个 月 都 会 收 到 一 份 对 
比 的 报告 ,显示 自家 用 电 在 整个 区 域 或 全 美 类 似 家 庭 中 所 处 的 水 平 ,以 鼓励 
节约 用 电 。 据 报道 ,Opower 的 服务 已 覆盖 了 美国 几 百 万 户 居民 家 庭 , 预计 
可 为 美国 消费 用 电 每 年 节省 5 亿美 元 。 

4 生物 信息 行业 

生物 信息 是 继 互联 网 行业 之 后 数据 进发 最 迅速 的 行业 ,并 将 远 远 超 过 
互联 网 产生 的 数据 : 人 类 用 0 和 1 创造 了 虚拟 世界 ,而 大 自然 用 A、C、T、G 
OREI Adenine, JUNIE Cytosine, Mg IRIE Thymine, $% GM Guanine) 四 
种 元 素 创 造 了 万 物 ,生命 的 产生 、 发 展 、 消 亡 的 奥秘 尽 在 其 中 。 随 着 测序 技 
术 的 发 展 ,全 基因 组 的 测序 价格 由 十 年 前 的 上 亿美 元 降 至 今天 的 数 千 美 元 ， 
这 使 得 更 多 人 物种 的 DNA 信息 的 获取 成 为 可 能 。 个 体 全 基因 组 信息 的 获 
取 , 使 得 个 性 化 诊疗 服务 成 为 可 能 。 大 数据 时 代 , 一 切 的 一 切 都 存在 着 可 
能 ,而 这 一 切 的 改变 我 们 也 正在 体验 之 中 。 

5 阿里 巴巴 


阿里 巴巴 旗下 的 淘宝 网 是 全 球 访问 量 最 大 的 电子 商务 网 站 。 以 前 , 淘 


宝 网 的 事务 处 理 依托 国际 数据 库 巨 头 甲骨 文 的 商业 数据 库 软件 ,成 本 很 高 ， 
但 性 能 和 可 扩展 性 较 差 ,制约 了 企业 发 展 。 几 年 前 ,淘宝 网 下 决心 使 用 开源 
软件 MySQL Cluster 替代 ,其 事务 处 理 的 性 能 和 可 扩展 性 都 有 了 数量 级 的 
提升 。 现 在 淘宝 网 的 全 部 应 用 软件 (包括 数据 魔方 等 数 十 种 大 数据 计算 应 
用 ) 和 基础 软件 都 是 自行 开发 或 采用 开源 软件 ,摆脱 了 商业 软件 制约 。 阿 里 
公司 根据 在 淘宝 网 上 中 小 企业 的 交易 状况 筛选 出 财务 健康 和 讲究 诚信 的 企 
业 , 对 其 发 放 无 须 担保 的 贷款 。 目 前 已 放贷 300 多 亿 元 ,坏账 率 仅 0.3% ,大 
大 低 于 商业 银行 。 

淘宝 网 还 建立 了 “淘宝 CPI ,通过 采集 、 编 制 淘宝 网 上 390 个 类 目的 热 
门 商品 价格 来 统计 CPI, 比 国家 统计 局 公布 的 CPI 还 提前 半 个 月 预测 经 济 的 
走势 。 

6 华 大 基因 公司 

华 大 基因 是 目前 世界 上 最 大 的 基因 组 学 研究 中 心 , 也 是 我 国 典型 的 大 
数据 处 理 和 应 用 公司 。 该 公司 建立 了 大 规模 基因 测序 、 克 隆 、 农 作物 基因 组 
等 技术 平台 ,测序 和 基因 组 分 析 能 力 世界 领先 。 目 前 , 华 大 基因 已 经 完成 了 
水 稻 、 人 谷子、 玉米 大豆、 番茄 等 重要 农作物 的 全 基因 组 测序 ,对 25 种 栽培 稻 
和 24 种 野生 稻 进 行 了 基因 组 扫描 和 分 析 , 找 到 了 162 个 基因 ,这 些 基 因 与 水 
稻 高 产 性 状 紧密 相关 。 该 公司 还 启动 了 百 万 人 基因 图 谱 计 划 ,预计 3 一 5 年 
内 测定 100 万 人 以 上 的 全 基因 组 图 谱 , 目 前 已 针对 染色 体 疾 病 等 多 种 疾病 开 
发 了 先进 的 基因 检测 技术 ,形成 了 贯穿 整个 生命 周期 的 基因 检测 与 诊断 技 
术 体 系 。 

了 农夫 山泉 

农夫 山泉 通过 大 数据 分 析 技 术 使 销售 额 提升 了 大 约 30% ,并 使 库存 周 
转 从 5 天 缩短 到 3 天 ,同时 其 数据 中 心 的 能 耗 降 低 了 约 80%。 

8 百分点 公司 


百分点 公司 拥有 海量 网 购 消费 者 偏好 数据 ,积累 了 超过 1. 4 亿 名 网 购 消 
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费 者 的 消费 偏好 和 200 多 亿 个 消费 偏好 标签 ,已 成 为 国内 最 大 的 跨 网 站 消费 
偏好 平台 。 

9 中 信和 银行 

中 信和 银行 信用 卡 中 心 通过 部 署 大 数据 分 析 系 统 ,实现 了 近似 实时 的 商 
业 智 能 和 秒 级 营销 ,运营 效率 得 到 全 面 提 升 ,每 次 营销 活动 配置 平均 时 间 从 
2 周 缩短 到 2 一 3 天 ,交易 量 增加 65% ,不 良 贷款 比率 同比 减少 了 0.76%. 


第 2 章 ”开放 数据 与 政府 信息 资源 利用 


21 信息 资源 管理 的 基本 框架 和 关键 技术 


21.1 传统 信息 资源 管理 的 基本 框架 


信息 资源 管理 主要 包括 信息 产生 、 信 息 采集 、 信 息 处 理 、 信 息 开发 利用 
和 信息 服务 五 个 阶段 ( 见 图 2. 1)。 
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信息 产生 信息 采集 信息 处 理 。 ] 信息 开发 利用 | 。 信息 服务 
政府 部 站 信息 交换 管理 数据 抽取 专题 分 析 可 视 化 服务 
组 织 机 构 信息 接 入 管理 数据 清洗 数据 挖掘 整合 服务 
高 等 院 校 信息 目录 管理 - 
| | || cree 查询 检索 街景 服务 
科研 院 所 基础 信息 管理 
有 = 数据 加 载 ZKA 5 w 
行业 协会 © Poa abated 
: MAR BR 专题 信息 | Or by 
基础 信 ! a 
企业 Pa O eman ae 
基础 信息 融合 信息 
安全 体系 、 标 准 规范 、 管 理 机 制 


图 2.1 信息 资源 管理 的 基本 框架 


1. 信息 采集 

信息 的 采集 方式 主要 有 四 种 。 

(1) 手工 填报 : 主要 用 于 层级 管理 中 ,由 下 层 部 门 通过 信息 系统 中 的 相 
关 流 程 进行 逐 项 填写 后 上 报 . 或 采用 导入 的 方式 批量 填报 。 

(2) 数据 获取 : 主要 通过 部 署 在 物理 世界 中 的 感知 设备 进行 实时 感知 =] 


信息 采集 ,感知 信息 通过 集中 器 终端 传输 网 络 通道 等 进行 传输 汇聚 。 | 
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(3) 数据 交换 : 主要 通过 在 各 信息 源 部 署 前 置 机 的 方式 ,实现 多 信息 源 
间 的 数据 互联 互通 。 

(4) 数据 接口 : 主要 通过 数据 接口 调用 的 方式 实现 数据 共享 和 服务 。 

采集 内 容 主要 分 为 五 类 。 

(1) 基础 信息 : 主要 指 管理 对 象 .感知 设备 等 实体 的 基础 属性 信息 。 

(2) 实时 信息 : 主要 指 来 源 于 感知 设备 的 实时 感知 信息 。 

(3) 交换 信息 : 主要 指 由 相关 的 信息 所 有 部 门 对 采集 的 数据 进行 解析 
处 理 后 ,按照 一 定 的 交换 规则 共享 的 信息 。 

(4) 综合 信息 : 主要 指 由 相关 的 信息 所 有 部 门将 实时 感知 信息 与 基础 
信息 和 业务 领域 的 主题 信息 进行 整合 融合 后 的 信息 。 

(5) 资源 描述 信息 : 主要 指 相关 的 信息 所 有 部 门 可 提供 共享 的 各 类 共 
享 服务 资源 的 元 数据 ,如 应 用 系统 元 数据 、Portlet 元 数据 页面 元 数据 ,数据 
库 元 数据 、Web 服务 元 数据 等 。 

2 信息 处 理 

信息 处 理 主要 完成 对 采集 信息 的 加 工整 理 , 对 采集 过 程 中 可 能 出 现 的 
噪声 数据 进行 清洗 ,转换 成 有 效 数据 。 

(1) 数据 抽取 : 从 数据 采集 过 程 形成 的 临时 库 、 基 础 库 中 抽取 相关 的 
数据 。 

(2) 数据 清洗 : 清除 脏 数 据 (dirty data) 或 噪声 ,以 保证 数据 质量 。 

(3) 数据 转换 : 通常 不 仅仅 是 数据 格式 的 转换 ,外 部 系统 中 的 数据 可 能 
包含 不 一 致 或 者 不 正确 的 信息 ,这 取决 于 外 部 系统 中 的 数据 情况 。 

转换 步骤 的 一 部 分 是 “净化 "或 “拒绝 "不 符合 条 件 的 数据 ,这 个 阶段 常 
用 的 技术 包括 字符 检查 (拒绝 包含 字符 的 数值 性 数据 ) 和 范围 检查 (拒绝 超 
出 可 接受 范围 的 数据 )。 被 拒绝 的 记录 通常 存放 在 单独 的 文件 中 ,使 用 更 复 
杂 的 工具 处 理 ( 或 者 手工 改正 问题 ), 然 后 将 这 些 数据 合并 到 已 转换 的 集合 
中 。 主 要 的 转换 方式 包括 以 下 五 种 : 一 是 数据 类 型 转换 ,将 数据 源 中 的 不 同 


数据 类 型 转换 成 需要 的 数据 类 型 ;二 是 数据 表示 方法 转换 ,命名 代码 统一 ， 
汉字 编码 同 义 , 度 量 衡 表示 统一 以 及 其 他 数据 表示 方法 的 统一 等 ;三 是 命名 
转换 ,将 数据 模式 、 表 名 、 属 性 名 转换 成 统一 命名 方式 ;四 是 数据 综合 , 按 粒 
度 要 求 对 动态 属性 数据 进行 统计 汇总 形成 综合 性 数据 ;五 是 数据 筛选 ,按照 
分 析 及 决策 的 需要 从 数据 源 中 作 纵向 的 属性 选择 及 横向 的 实例 选择 。 

(4) 数据 加 载 与 刷新 : 将 获取 并 转换 的 数据 存放 到 新 的 数据 库 中 。 

3. 信息 资源 开发 利用 

信息 资源 的 开发 利用 主要 是 按照 需求 将 采集 到 的 信息 进行 整合 ,为 上 

应 用 等 提供 支撑 , 主要 包括 以 下 三 个 方面 。 

(1) 数据 关系 映射 : 将 管理 对 象 . 感 知 设备 .实时 信息 、 信 息 主体 (部 门 ) 

等 之 间 建 立 关 联 关系 ,形成 支持 应 用 的 主题 信息 库 , 在 主题 信息 库 的 基础 上 

形成 信息 融合 库 。 

(2) 分 析 建 模 : 按照 应 用 需求 ,建立 分 析 模 型 , 为 领域 应 用 提供 调用 
服务 。 

(3) 空间 信息 整合 : 通过 物 联 信息 .决策 模型 与 空间 图 层 的 整合 ,实现 
信息 的 可 视 化 全景 化 .空间 化 呈现 。 

4 标准 规范 

标准 规范 的 重点 主要 包括 多 源 信息 的 统一 编码 、 基 础 信息 的 属性 规范 、 
多 源 信息 的 共享 流程 .多 源 信息 的 交换 与 传输 、 信 息 目 录 信 息 接 入 方式 等 

5. 信息 管理 

信息 管理 主要 包括 数据 更 新 管理 ,数据 使 用 管理 以 及 数据 的 存储 和 备 
份 。 在 数据 更 新 时 ,必须 进行 数据 质量 控制 。 对 入 库 数 据 质量 进行 严格 把 
关 。 在 数据 入 库 时 ,对 数据 的 合法 性 进行 检查 ,并 对 数据 之 间 的 关系 建立 关 
联 ,检查 源 及 目的 数据 结构 的 逻辑 对 应 关系 是 否 正确 ;审核 数据 更 新 标志 ; 
然后 在 数据 提交 过 程 中 检查 数据 及 代码 的 完整 性 ,合法 性 ,保证 数据 一 
致 性 。 
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C1) 更 新 管理 : 系统 数据 要 具有 现势 性 , 即 数据 要 反应 最 新 的 现实 情 
况 。 因 此 要 建立 和 形成 一 种 有 效 的 、 实 时 的 数据 更 新 机 制 ,同时 发 展 实用 
的 ,经 济 快捷 的 更 新 手段 和 技术 方法 ,以 保持 数据 的 现势 性 ,这 样 才能 保证 
系统 进行 的 查询 分析、 咨询 决策 等 结果 的 正确 性 。 

(2) 日 志 记 录 : 数据 处 理 日 志 分 为 三 类 。 一 是 数据 处 理 执行 过 程 日 志 ， 
是 在 数据 处 理 执行 过 程 中 每 执行 一 步 的 记录 ,用 流水 账 形式 记录 每 次 运行 
每 一 步骤 的 起 始 时 间 及 影响 了 多 少 行 数据 ;二 是 异常 日 志 , 当 某 个 执行 过 程 
出 错 的 时 候 写 错误 日 志 , 记 录 每 次 出 错 的 时 间 、 出 错 的 位 置 以 及 出 错 的 信息 
等 ;三 是 任务 日 志 , 只 记录 任务 开始 时 间 、 结 束 时 间 及 是 否 成 功 等 信息 。 

(3) 数据 库 系 统 安全 访问 控制 : 严格 控制 数据 库 系 统 的 访问 控制 权限 ， 
对 不 同 的 用 户 进行 不 同 数据 库 的 访问 控制 ,同时 删除 不 用 的 数据 库 用 户 , 确 
保 非 法 用 户 对 数据 库 系 统 的 访问 ;对 数据 库 用 户 的 密码 严格 保密 ,使 其 不 被 
不 相关 的 人 员 非 法 获取 ;为 数据 库 系 统 设 置 防火 墙 , 将 数据 库 系 统 设置 到 防 
火 墙 内 ,利用 防火 墙 的 安全 访问 控制 策略 ,分 别 控制 不 同 的 用 户 、IP 对 数据 
库 系统 的 访问 级 别 ; 限 制 数据 库 系统 的 客户 端 对 数据 库 系统 的 非法 访问 。 

(4) 备份 与 恢复 : 为 了 确保 数据 安全 可 靠 ,使 信息 系统 正常 运行 ,需要 
对 信息 系统 的 数据 进行 定期 备份 ,以 便 在 发 生 数据 库 严 重 故 障 时 利用 备份 
的 数据 进行 恢复 。 数 据 的 备份 策略 根据 不 同 的 数据 进行 不 同 的 定义 。 初 始 
化 数据 在 加 载 完成 后 进行 一 次 性 的 备份 ;配置 数据 .控制 数据 在 信息 系统 每 
次 配置 变动 后 立即 进行 自动 备份 ;信息 系统 的 业务 数据 需要 建立 详细 的 备 
份 策略 实现 联机 和 脱 机 两 种 备份 。 


212 物 联 信 息 管理 的 关键 技术 


随 着 摄像 头 ,传感器 等 各 种 感知 终端 的 普及 应 用 ,来 源 于 物理 世界 的 物 
联 信息 日 益 庞 大 ,在 信息 源 \ 信 息 载体 、 传 输 频率 等 方面 具有 区 别 于 传统 信 
息 资源 的 鲜明 特征 , 正 逐 渐 成 为 城市 大 数据 的 主体 。 从 物 联网 的 技术 体系 
上 看 , 物 联 信 息 的 管理 涉及 到 “ 感 , 传 、 知 、 用 ”四 个 层面 的 关键 技术 。 


1. 感知 层 关 键 技术 

感知 层 技术 是 物 联 信息 采集 的 核心 技术 ,按照 国际 电信 联盟 (ITU) 的 划 
分 ,感知 层 的 关键 技术 主要 包括 射频 识别 技术 (RFID) ,传感器 技术 、 智 能 能 
入 技术 等 。 

1) 射频 识别 技术 

射频 识别 技术 是 20 世纪 90 年 代 兴 起 的 一 种 非 接触 式 自动 识别 技术 ,该 
技术 的 商用 促进 了 物 联网 的 发 展 。 它 通过 射频 信号 等 一 些 先进 手段 自动 识 
别 目标 对 象 并 获取 相关 数据 ,有 利于 人 们 在 不 同 状态 下 对 各 类 物体 进行 识 
别 与 管理 。 

射频 识别 系统 通常 由 电子 标签 和 阅读 器 组 成 。 电 子 标签 内 存 有 一 定格 
式 的 标识 物体 信息 的 电子 数据 ,是 代替 条 形 码 走 进 物 联网 时 代 的 关键 技术 

该 技术 具有 一 定 的 优势 : 能 够 轻易 髋 入 或 附着 ,并 对 所 附着 的 物体 进 

行 追 踪 定 位 , 读 取 距 离 更 远 , 存 取 数据 时 间 更 短 ;标签 的 数据 存 取 有 密码 保 
护 , 安 全 性 更 高 。RFID 目前 有 很 多 频段 ,其 中 集中 在 13. 56MHz 频段 和 
900MHz 频段 的 无 源 射频 识别 标签 应 用 最 为 常见 。 短 距离 应 用 方面 通常 采 
用 13.56MHz HF 频段 ;而 900MHz 频段 多 用 于 远 距离 识别 ,如 车 辆 管理 、 
产品 防伪 等 领域 。 阅 读 器 与 电子 标签 可 按 通信 协议 互 传 信息 , 即 阅 读 器 向 
电子 标签 发 送 命令 ,电子 标签 根据 命令 将 内 存 的 标识 性 数据 回 传 给 阅读 器 。 

RFID 技术 与 互联 网 ,通信 等 技术 相 结合 ,可 实现 全 球 范 围 内 物品 跟踪 
与 信息 共享 。 但 其 技术 发 展 过 程 中 也 遇 到 了 一 些 问题 ,主要 在 于 芯片 成 本 ; 
还 有 RFID 反 磁 撞 防 冲突 、RFID 天 线 研究 、 工 作 频 率 的 选择 及 安全 隐私 等 问 
题 ,也 在 一 定 程度 上 制约 了 该 技术 的 发 展 。 

2) 传感器 技术 

国家 标准 (GB/T 7665 一 2005) 中 对 传感器 的 定义 是 : 能 感受 被 测量 并 
按照 一 定 的 规律 转换 成 可 用 输出 信号 的 器 件 或 装置 ,通常 由 敏感 元 件 和 转 
换 元 件 组 成 。 传 感 器 技术 是 涉及 物理 学 、 化 学 、 生 物 学 、 材 料 科 学 、 电 子 学 以 
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及 通信 与 网 络 技术 等 多 学 科 交 叉 的 高 新 技术 ,作为 当代 信息 技术 中 信息 获 
取 的 重要 手段 ,已 广泛 应 用 于 工业 农业 、 国 防 、 医 疗 卫 生 等 人 民生 活 和 国民 
经 济 建设 的 各 个 领域 。 

传感器 技术 与 通信 技术 、 计 算 机 技术 一 起 被 称 为 信息 技术 的 三 大 支柱 ， 
分 别 对 应 了 “ 感 ”…“ 传 ”“ 知 ”三 个 层面 。 传 感 器 技术 是 从 自然 信 源 获取 信 
息 ,并 对 之 进行 处 理 (变换 ) 和 识别 的 多 学 科 交 叉 的 现代 科学 与 工程 技术 。 
传感器 技术 的 核心 即 传感器 , 它 是 负责 实现 物 联 网 中 物 与 物 、 物 与 人 信息 交 
互 的 重要 组 成 部 分 。 

目前 ,传感器 技术 已 由 传统 的 机 械 结构 型 ,经 过 机 电 型 .固体 传感器 、 集 
成 传感器 进入 到 微 传感器 和 微 系统 的 阶段 ,并 朝 着 微型 化 、 集 成 化 ,智能 化 、 
网 络 化 的 方向 发 展 。 

按照 传感器 的 监测 数据 的 不 同 ,可 以 将 传感器 划分 为 三 种 : 一 是 应 用 于 
工业 领域 的 传感器 ,如 温度 传感器 、 压 力 传感器 .物理 量 传感器 、 流 量 传感器 
等 ;二 是 民用 领域 传感器 ,如 RFID 传感器 、 二 维 码 光 学 传感器 等 ;三 是 多 媒 
体 类 型 的 传感器 ,如 音频 传感器 .视频 传感器 无线 音频 视频 传感器 .可 自由 
编程 万 能 音频 传感器 等 。 

目前 传感器 技术 越 来 越 受 到 普遍 的 重视 , 它 的 应 用 已 渗透 到 国民 经 济 
的 各 个 领域 ,涵盖 工业 生产 过 程 的 测量 与 控制 .汽车 电 控 系 统 、 现 代 医 学 、 环 
境 及 军事 等 多 个 方面 。 大 规模 集成 电路 、 微 纳 加 工 、 网 络 等 技术 的 发 展 ,为 
传感器 技术 的 发 展商 定 了 基础 。 随 着 生产 自动 化 程度 及 人 们 生活 水 平 的 日 
益 提 高 ,对 传感器 的 要 求 也 日 益 提高 。 技 术 推动 和 需求 牵引 共同 决定 了 未 
来 传 感 技术 的 发 展 趋势 ,主要 包括 四 个 方面 。 

(1) 微型 化 : 采用 微 加 工 手段 和 纳米 制备 技术 ,可 加 工 出 特征 尺寸 达到 
微米 甚至 纳米 的 微型 器 件 ,同时 带 来 功 耗 的 降低 。 

(2) 集成 化 : 包括 传感器 与 IC 的 集成 制造 技术 以 及 多 参量 传感器 的 集 
成 制造 技术 ,缩小 了 传感器 的 体积 ,提高 了 检测 精度 。 

(3) 智能 化 : 智能 化 是 在 集成 化 基础 上 的 更 进一步 发 展 ,使 得 信号 检测 


具有 一 定 的 智能 ,包括 传感器 的 自 校准 ,可 根据 被 测量 的 变化 实时 调节 量程 
和 精度 ,模式 识别 等 。 

(4) 网 络 化 : 传感器 网 络 化 极 大 地 增强 了 传感器 的 探测 能 力 , 是 近 几 年 
来 的 新 的 发 展 方向 。 

3) HAR RBA 

嵌入 式 系统 是 以 应 用 为 中 心 , 以 计算 机 技术 为 基础 ,其 软 硬 件 可 裁剪 ， 
适用 于 对 功能 、 可 靠 性 、 成 本 、 体 积 、 功 耗 有 严格 要 求 的 专用 计算 机 系统 。 它 
一 般 由 艇 和 人 式微 处 理 器 .外 围 硬 件 设备 .嵌入 式 操作 系统 以 及 用 户 的 应 用 程 
序 四 个 部 分 组 成 ,具有 对 其 他 设备 的 控制 监视 或 管理 等 功能 。 

目前 ,大 多 数 冤 入 式 系 统 还 处 于 单独 应 用 的 阶段 ,以 微 控 制 器 
(Microcontroller Unit,MCU ) 为 核心 ,与 一 些 监 测 .伺服 .指示 设备 配合 实现 
一 定 的 功能 。 互 联网 现 已 成 为 社会 重要 的 基础 信息 设施 之 一 ,是 信息 流通 
的 重要 渠道 。 如 果 艇 入 式 系统 能 够 连接 到 互联 网 上 , 则 几乎 可 以 方便 .低廉 
地 将 信息 传送 到 世界 上 的 任何 一 个 地 方 。 

2 传输 层 关 键 技术 

传输 层 主要 负责 信息 传递 和 信息 控制 ,提供 端 到 端的 交换 数据 的 机 人 制 ， 
实现 物 与 物 之 间 的 “互联 "。 目 前 物 联 信息 传输 的 关键 技术 主要 包括 3G 技 
AL AG 技术 .蓝牙 技术 .智能 网 关 技术 (NFC) 等 。 

1) 3G 技术 

第 三 代 移动 通信 技术 (3rd-generation,3G) 是 指 支持 高 速 数据 传输 的 蜂 
窝 移动 通信 技术 。3G 服务 能 够 同时 传送 声音 及 数据 信息 ,速率 一 般 在 几 百 
kbps 以 上 。3G 主要 存在 四 种 标准 : CDMA2000, WCDMA, TD-SCDMA, 
WiMax。 第 三 代 移动 通信 系统 的 一 个 突出 特色 就 是 . 在 未 来 移动 通信 系统 
中 实现 个 人 终端 用 户 能 够 在 全 球 范围 内 的 任何 时 间 、 任 何 地 点 ,与 任何 人 ， 
用 任意 方式 ,高 质量 地 完成 任何 信息 之 间 的 移动 通信 与 传输 。 
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2) 4G 技术 

4G 技术 又 称 IMT-Advanced 技术 。 准 4G 标准 是 业内 对 TD 技术 向 4G 
发 展 的 TD-LTE-Advanced 的 称谓 。 

4G 通信 系统 采用 了 一 些 不 同 于 3G 的 技术 。4G 中 将 使 用 的 核心 技术 ， 
总 结 起 来 ,有 下 列 几 种 : 正 交 频 分 复 用 (Orthogonal Frequency Division 
Multiplexing, OFDM), 软件 无 线 电 、 智 能 天 线 技术 、 多 输入 多 输出 
(Multiple-Input Multiple-Output, MIMO) 、 基 于 IP 的 核心 网 。 国 际 电信 联 
盟 (CITU) 划 定 的 4G 标准 主要 有 五 种 : LTE-Advanced, WirelessMAN- 
Advaneed、WiMax、HSPA 十 和 LTE。 

3) 蓝牙 技术 

蓝牙 技术 是 一 种 支持 设备 短 距 离 通信 (一 般 10m 内 ) 的 无 线 电 技术 。 它 
能 在 包括 移动 电话 、.PDA 无 线 耳 机 ,笔记 本 电脑 \ 相 关外 设 等 众多 设备 之 间 
进行 无 线 信息 交换 。 利 用 蓝牙 技术 ,能 够 有 效 地 简化 移动 通信 终端 设备 之 
间 的 通信 ,也 能 够 成 功 地 简化 设备 与 Internet 之 间 的 通信 ,从 而 使 数据 传输 
更 加 迅速 ,高效 ,为 无 线 通 信 拓 宽 道路 。 蓝 牙 技 术 采 用 分 散 式 网 络 结构 以 及 
快 跳 频 和 短 包 技术 ,支持 点 对 点 及 点 对 多 点 通信 ,工作 在 全 球 通用 的 
2. 4GHz ISM( 即 工业 、 科 学 、 医 学 ) 频 段 ,其 数据 速率 为 1Mbps, 采 用 时 分 双 
工 传输 方案 实现 全 双 工 传输 。 

4) 智能 网 关 技 术 

智能 网 关 技 术 是 应 用 网 关 技 术 的 一 种 ,其 主要 功能 是 自动 完成 对 系统 
中 大 量 基站 监控 数据 的 提取 、 处 理 和 转发 ,实现 系统 之 间 的 交互 连接 与 对 
话 。 目 前 ,智能 网 关 技 术 广 泛 应 用 于 通信 移动、 家庭 等 各 个 方面 。 

物 联网 网 关 可 以 实现 感知 网 络 与 通信 网 络 .以 及 不 同类 型 感知 网 络 之 
间 的 协议 转换 , 既 可 以 实现 广 域 互 联 , 也 可 以 实现 局 域 互 联 。 此 外 物 联 网 网 
关 还 需要 具备 设备 管理 功能 。 运 营 商 通过 物 联 网 网 关 设 备 可 以 管理 底层 的 
各 感知 节点 ,了 解 各 节点 的 相关 信息 ,并 实现 远程 控制 。 


3 智能 处 理 层 技术 

智能 处 理 层 综合 运用 高 性 能 计算 .人 工 智 能 、 数 据 库 和 模糊 计算 等 技 
术 , 对 收集 的 感知 数据 进行 通用 处 理 , 主 要 涉及 海量 数据 存储 技术 、 云 计算 
技术 ,数据 挖掘 技术 .SOA 技术 、 中 间 件 技术 等 关键 技术 。 

1) 海量 数据 存储 技术 

海量 信息 存储 是 一 个 包括 网 络 设备 .存储 设备 .服务 器 .应 用 软件 公共 
访问 接口 . 接 入 网 络 和 客户 端 程序 等 多 个 组 成 部 分 的 系统 。 基 本 是 以 服务 
器 为 中 心 的 处 理 模 式 , 使 用 直 连 存储 (Direct Attached Storage. DAS) ,存储 
设备 (包括 磁盘 阵列 、 磁 带 库 、 光 盘 库 .硬盘 等 ) 作 为 服务 器 的 外 设 使 用 。 

随 着 网 络 技 术 的 发 展 ,服务 器 之 间 交 换 数据 或 向 磁盘 库 等 存储 设备 备 
份 时 ,都 是 通过 局 域 网 进行 ,主要 应 用 网 络 附加 存储 (Network Attached 
Storage,NAS) 技 术 来 实现 网 络 存储 ,将 占用 大 量 的 网 络 开销 ,严重 影响 网 络 
的 整体 性 能 。 为 了 能 够 共享 大 容量 的 高 速度 存储 设备 ,不 占用 局 域 网 资源 
进行 海量 信息 传输 和 备份 ,通常 需要 专用 存储 网 络 来 实现 。 

2) 云 计 算 技术 

云 计 算 (Cloud Computing) 是 分 布 式 计算 技术 的 一 种 ,通过 网 络 将 庞大 
的 计算 处 理 程序 自动 分 拆 成 多 个 较 小 的 子 程序 ,再 交 由 多 部 服务 器 所 组 成 
的 庞大 系统 经 搜寻 、 计 算 、 分 析 之 后 将 处 理 结果 回 传 给 用 户 。 云 计算 的 核心 
内 涵 是 计算 服务 化 、 资 源 虚 拟 化 和 管理 智能 化 。 云 计算 的 核心 思想 是 将 大 
量 用 网 络 连接 的 计算 资源 统一 管理 和 调度 ,构成 一 个 计算 资源 池 向 用 户 提 
供 按 需 服务 。 

云 计算 系统 的 关键 技术 主要 包括 编程 模型 .数据 管理 技术 、 数 据 存储 技 
术 , 虚 拟 化 技术 、 云 计算 平台 管理 技术 等 。 

3) 数据 挖掘 技术 

数据 挖掘 (Data Mining,DM) 是 从 存放 在 数据 库 、 数 据 仓库 或 其 他 信息 
库 的 大 量 数据 中 获取 有 效 的 、 新 颖 的 、 潜 在 有 用 的 、 最 终 可 理解 的 模式 的 非 
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平凡 过 程 。 在 人 工 智 能 领域 ,数据 挖掘 习惯 上 又 称 为 数据 库 中 的 知识 发 现 
(Knowledge Discovery in Database. KDD) ,数据 挖掘 也 是 数据 库 中 知识 发 
现 过 程 的 一 个 基本 步骤 。 

现在 ,数据 挖掘 技术 已 经 发 展 成 熟 的 三 种 基础 技术 是 海量 数据 搜集 、 强 
大 的 多 处 理 器 计算 机 和 数据 挖掘 算法 ,并 已 经 广泛 应 用 于 商业 数据 仓库 和 
计算 机 自动 收集 的 数据 记录 等 超大 规模 数据 库 。 

数据 挖掘 的 工作 过 程 主要 包括 数据 的 抽取 、 数 据 的 存储 和 管理 .数据 的 
展现 等 。 数 据 挖掘 的 工作 过 程 如 图 2. 2 所 示 。 


被 同化 


选择 预 处 理 转换 | [挖掘 分 析 和 同化 


图 2.2 数据 挖 气 的 工作 过 程 


4) SOA 技术 

SOA (Service-oriented Architecture, 面 向 服务 的 体系 架构 ) 技 术 是 一 种 
松 耦 合 的 软件 组 件 技术 , 它 将 应 用 程序 的 不 同 功能 模块 化 ,并 通过 标准 化 的 
接口 和 调用 方式 联系 起 来 ,实现 快速 可 重用 的 系统 开发 和 部 署 。SOA 可 提 
高 物 联 网 架构 的 扩展 性 ,提升 应 用 开发 效率 ,充分 整合 和 复 用 信息 资源 。 

5) 中 间 件 技术 

中 间 件 是 一 种 独立 的 系统 软件 或 服务 程序 。 分 布 式 应 用 软件 借助 中 间 
件 技术 在 不 同 的 技术 之 间 共 享 资源 。 通 过 中 间 件 相连 接 的 系统 或 应 用 
可 以 工作 于 多 平台 或 操作 系统 (Operating aR IN 的 
高 效 交 换 。 

4 应 用 层 关 键 技术 


物 联 网 应 用 层 的 相关 技术 主要 包括 家 庭 物 联网 应 用 涵盖 的 技术 和 企业 
物 联 网 应 用 的 相关 技术 。 家 庭 物 联 网 应 用 的 相关 技术 比如 家 电 智 能 控制 技 


AR 家庭 安防 监控 技术 。 企 业 物 联 网 应 用 的 相关 技术 现 阶段 比较 典型 的 技 
术 主 要 包括 智能 家 电 控 制 技术 石油 监控 应 用 技术 .电力 抄 表 、 车 载 应 用 技 
术 等 。 此 外 ,还 有 对 这 些 应 用 进行 支撑 的 网 络 管理 技术 和 安全 保障 技术 。 

1) 智能 家 电 控 制 技术 

智能 家 电 是 微 处 理 器 和 计算 机 技术 引入 家 电 设 备 后 形成 的 家 电 产 品 ， 
是 具有 自动 监测 、 自 动 测量 、 自 动 控 制 及 自动 调节 与 远方 控制 中 心 通信 功能 
的 家 电 设备 , 可 通过 物 联网 的 相关 通信 协议 和 控制 设备 相连 并 进行 通信 。 
智能 家 用 电器 目前 所 采用 的 智能 控制 技术 主要 是 模糊 控制 等 技术 。 少 数 高 
档次 的 家 用 电器 也 用 到 神经 网 络 技术 (也 叫 神经 网 络 模糊 控制 技术 ) ,模糊 
控制 技术 目前 是 智能 家 用 电器 使 用 最 广泛 的 智能 控制 技术 。 原 因 在 于 这 种 
技术 和 人 的 思维 具有 一 致 性 ,可 以 用 相对 简单 的 数理 逻辑 在 单片机 或 能 人 
式 设 备 上 进行 构造 。 

2) 家 庭 安 防 监控 技术 

基于 物 联 网 的 家 庭 安 防 监控 技术 区 别 于 传统 家 庭 安 防 监控 技术 的 地 方 
主要 是 采用 RFID, 传感器 以 及 M2M(Machine to Machine, 机 -机 ) 设 备 来 完 
成 家 庭 安防 的 监控 ,基于 物 联网 的 家 庭 安防 系统 主要 由 主 控 模 块 . 图 像 采 集 
模块 .无线 通信 模块 和 传感器 模块 组 成 。 其 中 无 线 通 信 模 块 通过 ZigBee 无 
线 网 络 与 传感器 模块 相连 ,完成 家 庭 安 防 的 监控 数据 采集 。 常 用 监控 模式 
通过 传感器 模块 采集 突 发 的 环境 参数 时 ,图 像 采 集 模块 开始 采集 家 庭 实 时 
图 像 ; 主 控 模块 将 图 像 发 送 到 户主 手机 ,户主 确认 是 否 有 意外 发 生 , 然 后 在 
远程 做 出 相应 处 理 。 基 于 物 联网 的 家 庭 安 防 监控 技术 具有 安装 方便 ,成 本 
低 、 人 性 化 ,操作 方便 \ 安 全 性 高 有 效 安防 等 特点 。 

3) 石油 监控 应 用 技术 

基于 物 联网 的 石油 监控 应 用 技术 是 指 通 过 传感器 等 相关 物 联网 设备 完 
成 石油 存储 库 区 的 烟 、 火 ,温度 ,湿度 等 环境 因素 的 采集 ,通过 网 络 将 各 个 传 
感 器 点 的 数据 进行 传送 和 远程 集中 .并 完成 远程 监控 。 当 烟 、 火 、 温 度 等 环 
境 因素 发 生 异 常 时 ,能 及 时 反映 到 监控 人 员 或 监控 设备 ,并 可 与 摄像 监控 设 
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备 相 结合 ,进行 石油 库 区 监控 的 防火 防盗 。 

4) 电力 抄 表 技 术 

电力 抄 表 技术 通常 采用 在 家 庭 用 户 的 电表 设备 上 安装 传感器 或 其 他 通 
信 装 置 ,通过 电力 网 络 的 通信 模块 与 之 通信 ,完成 家 庭 用 户 用 电 数 据 的 远程 
抄 取 ,完成 电力 设备 的 智能 化 、 远 程 化 、 自 动 化 管理 。 

5) 车 载 应 用 技术 

基于 物 联 网 的 车 载 应 用 技术 主要 通过 无 线 设备 采集 车 载 物 联 网 设备 的 
信号 ,可 以 实时 获得 车 辆 的 相关 位 置 .速度 .行驶 方向 等 信息 ,并 可 通过 相关 
语音 通信 协议 建立 与 车 辆 的 实时 语音 通信 ,基于 物 联网 技术 的 车 载 应 用 技 
术 目 前 有 较 广 阔 的 发 展 前 景 。 目 前 较 常 用 的 车 载 应 用 之 一 是 通过 车 载 
RFID 或 传感器 实时 获得 车 辆 的 位 置信 息 , 并 完成 GPS 信息 的 实时 上 传 和 
下 载 。 

6) 网 络 管理 技术 

物 联网 具有 “自治 .开放 多样" 的 自然 特性 ,这 些 自然 特性 与 网 络 运 行 
管理 的 基本 需求 存在 着 突出 的 矛盾 , 需 研究 新 的 物 联 网 管理 模型 与 关键 技 
术 ,保证 网 络 系统 正常 高 效 地 运行 。 

7) 安全 保障 技术 

安全 是 基于 网 络 的 各 种 系统 运行 的 重要 基础 之 一 , 物 联网 的 开放 性 、 包 
容 性 和 匿名 性 也 决定 了 不 可 避免 地 存在 信息 安全 隐患 ,需要 研究 物 联网 安 
全 关键 技术 ,满足 机 密 性 、 真 实 性 、 完 整 性 、 抗 抵赖 性 的 四 大 要 求 ,同时 还 需 
解决 好 物 联网 中 的 用 户 隐 私 保护 与 信任 管理 问题 。 


22 开放 数据 : 传统 信息 壁垒 的 破局 点 
开放 数据 运动 已 在 全 球 逐 步 兴 起 ,各 国政 府 、 主 要 城市 和 地 区 都 已 经 意 


识 到 开放 的 数据 是 一 个 具有 巨大 潜力 的 未 开发 的 资源 ,是 一 个 国家 或 地 区 
的 重要 资产 。 从 国家 和 区 域 的 层面 上 看 ,进行 合理 的 统筹 规划 ,整合 地 方 和 


部 门 的 不 同 信息 源 ,建设 统一 的 数据 开放 门户 ,围绕 社会 需求 逐步 向 公众 开 
放免 费 、 机 器 可 读 的 数据 集 ,鼓励 第 三 方 的 机 构 或 个 人 基于 数据 集 开 发 各 种 
应 用 程序 ,服务 于 政府 管理 .企业 经 营 和 大 众生 活 ,已 成 为 大 势 所 趋 。 


221 全 球 开 放 数 据 运 动 


根据 英国 开放 知识 基金 会 (Open Knowledge Foundation) H E X, “FF 
放 ”(openness) 需 具备 以 下 三 项 基本 元 素 。 

(1) 非 歧视 性 : 数据 车 开放 , 则 其 对 任何 人 都 开放 。 

(2) 机 器 可 读 性 : 数据 车 开放 , 则 应 是 机 器 可 读 格式 。 例 如 对 于 表格 数 
据 , 应 该 采用 . csv, 而 非 . pdf。 

(3) 开放 授权 性 : 数据 车 开放 , 则 其 对 应 授权 条 款 应 确保 使 用 者 自由 免 
费 访问 .获取 、 使 用 .加 值 演绎、 复制 传播 的 权利 。 

随 着 互联 网 移动 互联 网 等 的 持续 发 展 ,政府 \ 企 业 , 行 业 组 织 和 个 人 等 
都 收集 了 广泛 的 ,不 同类 型 的 数据 。 但 是 ,人 们 对 于 各 种 经 过 官方 处 理 之 后 
的 统计 数据 普遍 持 有 一 定 的 怀疑 态度 ;而 未 处 理 的 原始 数据 ,大 部 分 人 又 难 bl 
以 理解 。 人 们 逐渐 意识 到 ,这 些 庞大 数据 资源 的 妥善 开放 利用 ,将 产生 巨大 
的 社会 价值 和 经 济 价值 。2010 年 4 月 ,互联 网 之 父 蒂 姆 . 伯 纳 斯 ， 李 在 
TED 大 会 ?上 号 召 大 家 把 公共 数据 或 私人 数据 共享 ,使 更 多 的 人 能 够 加 以 
利用 ,创造 出 有 用 的 其 至 是 令 人 意 想不到 的 结果 ,由 此 开启 了 “开放 数据 

开放 数据 是 一 种 新 的 哲学 理念 与 实践 , 它 按照 用 户 特 定 的 需求 和 相应 
的 协议 ,规则 ,框架 ,对 数据 进行 采集 、 存 储 、 发 布 . 加 工 、 链 接 等 ,以 实现 局 域 
或 全 部 数据 可 以 被 任何 人 自由 获取 、 互 通 、 共 享 、 重 用 ,没有 来 自 版 权 、 专 利 
或 其 他 机 制 的 限制 。 
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一 般 而 言 , 开 放 数据 具有 三 个 典型 特征 : 一 是 可 获取 性 和 可 访问 性 ;二 
是 数据 应 当 使 用 允许 再 利用 和 再 分 发 的 许可 协议 :三 是 普遍 参与 性 , 即 每 一 
个 人 都 应 当 能 够 使 用 .再 利用 、 再 分 发 这 些 数据 。 由 于 开放 数据 概念 在 不 断 
演变 ,开放 数据 还 应 该 具备 “ 互 用 性 ”", 并 基于 此 提出 了 关联 开放 数据 
(Linked Open Data) 的 概念 。 互 用 性 的 核心 在 于 开放 数据 间 的 自由 整合 、 关 
联 能 力 , 是 体现 “开放 性 ”实际 益处 的 关键 ,为 数据 的 再 利用 和 增值 提供 了 
可 能 。 

根据 数据 所 在 领域 以 及 数据 主体 的 不 同 ,可 以 把 开放 数据 细 化 成 许多 
分 支 , 其 中 ,开放 科学 数据 (Open Science Data) 和 开放 政府 数据 (Open 
Government Data) 是 当前 最 热 的 两 大 领域 。 特 别 是 开放 政府 数据 ,由 于 总 
量 以 及 种 类 庞大 繁多 ,与 民众 生活 密切 相关 ;而 且 因 为 大 部 分 政府 数据 本 身 
受 法 律 的 规定 需要 公开 .所 产生 的 效益 也 最 受 关注 。 如 无 特别 说 明 , 后 文中 
提 到 的 开放 数据 一 般 均 指 开放 政府 数据 。 

如 果 将 开放 数据 运动 比 作 一 场 马拉松 ,那么 开放 数据 运动 的 前 半 程 则 
完全 由 政府 透明 化 在 推动 。 事 实 上 ,最 早 开启 开放 数据 运动 的 美国 就 是 以 
2009 年 奥巴马 签署 的 (开放 政府 指令 》(Open Government Directive) 为 基 
础 , 朝 着 让 政府 更 透明 .让 民众 更 好 地 监督 政府 运作 的 方向 ,推进 开放 数据 
的 发 展 。 在 这 个 过 程 中 ,政府 预算 ,政府 支出 政府 选举 3 项 数据 是 开放 政府 
数据 计划 中 的 重点 对 象 ,因此 美国 奥巴马 政府 在 2014 年 进一步 推动 了 (数据 
TE) (Data Act) 的 通过 ,从 而 加 强 了 政府 预算 和 支出 数据 的 开放 。 

美国 自然 不 是 唯一 通过 开放 数据 实现 政府 透明 的 国家 。 根 据 开放 政府 
伙伴 (Open Government Partnership) 计 划 的 记录 ,目前 全 球 共有 超过 60 个 
国家 加 入 了 伙伴 计划 。 而 作为 伙伴 计划 成 员 , 需 要 承诺 的 便 是 开放 政府 数 
据 , 从 而 通过 数据 开放 实现 政府 的 透明 化 ,帮助 民众 问 责 政府 。 

从 2009 年 起 ,美国 英国. 加拿大、 新西兰 等 发 达 国家 政府 相继 宣布 了 其 
公共 数据 开放 计划 。 据 美国 网 站 Data. gov 的 统计 ( 见 图 2. 3) ,截至 2013 年 
8 月 ,全 球 有 43 个 国家 、160 个 地 区 已 经 上 线 开放 数据 或 者 开放 政府 信息 的 


相关 站 点 。 美 国 . 英 国 、 加 拿 大 和 法 国 是 开放 数据 的 先行 者 , 且 数 据 的 可 用 
性 较 高 ;新加坡 、 丹 麦 .意大利 .新西兰 等 国 是 追随 者 ,处 于 第 二 梯队 ; 澳 大 利 
亚 、 爱 沙 尼 亚 等 则 处 于 起 步 阶段 ,处 于 第 三 梯队 。 
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图 2.3 全 球 开放 数据 主要 参与 者 及 其 角色 


2013 年 6 月 ,八国 峰会 (G8 Summit) 期 间 签署 了 《八国 集团 开放 数据 宪 
章 )(G8 Open Data Charter) ,简称 (G8 开放 数据 宪章 ,标志 着 开放 政府 数 
据 已 经 成 为 全 球 共识 。 

相 比 国外 的 开放 数据 进程 ,我 国 的 开放 数据 起 步 略 显 滞后 。 根 据 复旦 
大 学 国际 关系 与 公共 事务 学 院 副教授 郑 磊 在 (中 国 开放 政府 数据 平台 研究 : 
框架 、 现 状 与 建议 )》 中 提供 的 数据 ,截至 2015 年 5 月 ,我国 各 地 开放 政府 数据 
实践 共计 发 布 了 1963 个 数据 集 ,其 中 开放 数据 集 最 多 的 是 武汉 (635 个 ) ,最 
少 的 则 是 贵州 (17 个 )。 

虽然 各 个 国家 开放 数据 特点 有 所 差异 ,但 总 体 上 可 以 分 为 三 个 阶段 : 被 
动 开 放 数 据 阶段 (1960 一 2009 年 ) .主动 开放 数据 阶段 (2009 一 2011 年 ) 和 挖 
掘 数 据 价 值 阶段 (2012 年 至 今 ) 。 
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222 开放 数据 的 社会 化 利用 


开放 数据 运动 产生 于 大 数据 测 涌 发 展 的 背景 下 并 非 偶 然 ,因为 政府 数 
据 的 权威 性 公益 性 和 全 局 性 ,使 之 成 为 大 数据 发 展 的 重要 补充 和 落地 应 用 
手段 。 例 如 : 芬兰 的 tax free 项 目 和 英国 的 where does my money go 项 目 
都 向 民众 展示 了 政府 如 何 使 用 税收 ;丹麦 的 folketsting. dk 项 目 追 踪 议 会 动 
态 以 及 立法 进度 ,公众 可 以 清楚 地 知道 议会 发 生 了 什么 ,哪些 议员 参与 其 
中 ;ODI 的 商业 计划 中 提 到 ,加 拿 大 政府 靠 开放 数据 挽救 了 32 ALIM TE HY KR 
善 税收 因 诈 骗 造成 的 损失 。 

开放 数据 能 够 成 为 公民 监督 政府 的 有 力 工 具 。 例 如 : 美国 加 州 政府 就 
将 金融 危机 的 纾 困 款 项 公之于众 ,居民 可 以 上 网 浏览 每 个 地 方 行政 单位 所 
得 到 的 经 费 。 

开放 数据 的 实施 有 利于 提高 政府 部 门 之 间 协 作 的 效率 。 开 放 数 据 的 包 
容 性 打开 了 政府 内 各 部 门 、 政 府 与 民众 之 间 的 边界 ,信息 孤岛 现象 不 再 存 
在 ,数据 共享 成 为 现实 。 一 方面 推动 了 政府 各 机 构 开放 创新 ,政府 各 部 门 开 
展业 务 数据 分 析 , 发 现 数据 背后 隐藏 的 模式 和 微妙 关系 ,用 新 思路 、 新 方法 、 
新 举措 破解 经 济 社会 发 展 过 程 中 过 到 的 各 种 问题 ,也 成 为 创新 的 主体 。 另 
一 方面 政府 各 机 构 提 供 数 据 、 问 题 和 激励 ,邀请 社会 公众 共同 解决 问题 , 通 
过 众 包 的 形式 激发 了 大 众 的 智慧 ,推动 了 社会 创新 。 

以 美国 纽约 市 为 例 ,2012 年 2 月 纽约 市 通过 了 《开放 数据 法 案 》, 当 年 3 
月 由 市 长 迈克 尔 。 布 隆 伯 格 签署 后 正式 生效 。 这 是 美国 历史 上 首次 将 政府 
数据 大 规模 开放 纳入 立法 。 之 后 随 着 详尽 犯罪 记录 数据 的 开放 ,不 仅 开发 
出 了 提示 公众 避免 进入 犯罪 高 发 区 域 和 提高 警惕 的 手机 应 用 .从 而 降低 了 
犯罪 发 生 的 概率 ;而 且 还 能 将 犯罪 记录 信息 和 动态 交通 数据 结合 起 来 ,起 到 
指导 调配 警力 的 作用 。 公 共 交 通 系统 的 动态 数据 公布 后 , 随 之 许多 学 者 和 
商业 机 构 分 别 对 其 进行 深度 挖掘 ,不 仅 创造 出 了 手机 应 用 ,为 公众 出 行 提供 
实时 建议 ,而 且 为 地 铁 系 统 在 客流 高 低 峰 时 段 对 热点 站 和 普通 站 之 间 的 调 


CHE TEAST SR. AER SE RLE TA EH A TF 
是 不 可 想象 的 。 

开放 数据 一 方面 推动 传统 企业 转型 , 另 一 方面 也 催生 了 许多 新 的 中 小 
企业 。 例 如 : 丹麦 的 husetsweb. dk 可 以 帮助 用 户 找到 提升 家 庭 能 源 使 用 效 
能 的 方法 ,包括 提供 财政 规划 和 联系 施工 承包 商 ;: 英 国 的 Mastodon C, 
Carbon Culture 和 Honest Buildings 等 都 是 利用 开放 数据 提供 服务 的 创新 
企业 :Google 翻译 服务 使 用 了 海量 的 欧盟 多 国语 言 文档 来 训练 其 翻译 算法 ， 
进而 提升 了 服务 质量 。 

美国 的 Zillow 公司 作为 一 家 市 值 30 亿美 元 的 公司 。 它 创建 了 一 个 在 
线 房产 交易 平台 , 供 房屋 产权 人 、 购 买 者 、 售 卖 者 .租赁 者 .中 介 、 出 租 者 、 贷 
款 经 纪 、 房 产 经 理 等 发 现 并 分 享 房产 及 周边 相关 (如 贷款 ) 信 息 。 整 个 平台 
由 一 个 记录 了 超过 1. 1 亿 条 美国 房产 记录 的 数据 库 驱 动 ,这 个 数据 库 中 既 有 
挂牌 出 售 的 房产 信息 ,也 有 未 挂牌 的 房产 信息 。Zillow 将 美国 政府 开放 的 土 
地 交易 记录 、 房 屋 交易 记录 、 房 屋 整 修 记 录 、 治 安 状况 等 有 关 社 区 状况 的 开 
放 数 据 整 合 进 原 有 平台 ,建立 了 更 为 合理 的 房屋 估 值 模型 。 

美国 的 Climate Corp 公司 于 2013 年 10 月 被 Monsanto 公司 以 9.3 亿 
美元 收购 。 它 利用 美国 政府 免费 开放 的 60 年 农作物 收成 数据 、 美 国 超过 
100 万 个 气象 监测 站 的 气象 数据 以 及 14 TB 的 土壤 质量 数据 ,为 农民 提供 农 
业 种 植 和 金融 决策 辅助 信息 。 它 的 一 款 主 打 产 品 是 “全 气候 保险 ”, 这 款 保 
险 产 品 将 在 系统 预测 有 恶劣 天 气 时 自动 赔付 农民 的 损失 ,而 不 需要 农民 举 
证 实际 损失 。Climate Corp 公司 是 2006 年 由 两 名 前 Google 公司 员工 创建 
的 , 它 每 天 要 利用 从 22 个 数据 集中 经 过 高 级 数据 分 析 产 出 的 300 万 份 数 据 
资料 。 这 些 数据 来 自 不 同 的 第 三 方 机 构 ,比如 美国 气象 局 ,并 且 这 些 数据 都 
是 免费 、 自 由 重复 使 用 的 。 

美国 的 Mastodon C 公司 成 立 于 2012 年 4 月 ,可 帮助 企业 运行 一 个 可 
定制 的 零 碳 云 基础 设施 ,并 通过 先进 的 分 析 建 议 帮助 其 客户 释放 数据 的 潜 
力 。 其 创始 人 Francine Bennett 认为 ,开放 数据 对 创业 企业 的 价值 是 难以 估 
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量 的 。Carbon Culture 提供 数字 服务 ,可 帮助 企业 加 强 沟 通 , 实 现 员工 参与 
和 直接 节约 能 源 , 使 其 转向 可 持续 发 展 。 

美国 的 ITriage 公司 是 一 个 初创 企业 。 它 由 一 个 急诊 室 医 生 创 建 , 目 前 
雇用 90 个 员工 。 该 公司 的 主要 业务 是 ,运用 从 美国 卫生 与 人 力 资 源 服务 部 
CHHS) 下 载 的 关于 健康 医疗 提供 者 的 位 置 和 特点 信息 ,开发 一 种 移动 应 用 。 
这 种 应 用 可 以 帮助 800 万 民众 发 现 满足 其 需求 的 .最 适合 的 当地 医生 和 医 
院 , 从 而 帮助 人 们 挽救 了 生命 。 

美国 的 OPower 公司 的 业务 是 运用 政府 发 布 的 有 关 能 源 使 用 .天 气 和 能 
源 设备 效能 的 数据 ,为 客户 提供 节约 能 源 的 个 性 化 建议 。 该 公司 目前 雇用 
员工 200 多 人 ,已 帮助 居民 客户 节约 1. 4 小 时 能 源 时 间 ( 相 当 于 一 个 小 城市 
全 部 家 庭 一 年 的 用 电量 ) 和 1. 65 亿美 元 的 能 源 。 


223 开放 数据 的 推进 模式 


1. 发 布 机 器 可 读 的 高 价值 数据 和 推动 数据 的 开发 利用 是 开放 数据 的 
两 大 重点 


开放 数据 要 满足 几 个 条 件 : 一 是 每 个 人 都 可 以 获取 ,二 是 机 器 可 读 ,三 
是 不 需要 成 本 就 可 以 获得 ,四 是 对 数据 再 使 用 和 分 发 没有 限制 。 可 见 , 开 放 
数据 的 关键 是 更 多 的 信息 发 现 和 信息 利用 。 因 此 ,开放 数据 并 不 是 简单 地 
将 数据 电子 化 、 格 式 化 ,怎样 降低 获取 数据 的 难度 和 提高 数据 的 再 利用 程度 
才 是 核心 。 

从 国外 开放 数据 的 发 展 阶段 来 看 ,当前 开放 数据 的 先行 国家 其 工作 重 
点 可 以 概括 为 以 下 两 个 方面 : 一 是 注重 以 机 器 可 读 的 方式 ,优先 发 布 高 价值 
的 数据 ;二 是 注重 数据 的 开发 再 利用 ,采取 一 些 激励 措施 ,激发 企业 家 和 创 
新 者 利用 开放 数据 开发 更 多 的 应 用 ,从 而 挖掘 政府 数据 的 潜力 ,积极 促进 经 
济 增长 和 创造 新 的 就 业 机 会 。 

2 建设 统一 门户 ,逐步 开放 数据 集 

从 全 球 范围 来 看 ,建立 统一 的 政府 开放 数据 门户 ,集中 开放 可 加 工 的 


数据 集 是 各 国 数据 门户 网 站 的 一 个 普遍 做 法 。 各 国 数据 门户 网 站 域名 中 
都 普遍 带 有 “数据 ”和 “政府 ”字样 ,如 data. gov( 英 语 )、datos. gob( 西 班 牙 
语 ) 等 。 在 门户 网 站 上 ,重点 开放 机 器 可 读 的 数据 集 (datasets) 、 应 用 程序 
(APPS) 等 资源 ,有 些 数 据 门 户 网 站 上 还 设置 了 供 开发 人 员 参 与 和 公众 反 
馈 的 专栏 。 

在 全 国 范围 内 建立 统一 的 开放 数据 门户 是 各 国 通行 做 法 ,但 是 由 于 国 
家 间 的 差异 ,有 些 地 方 和 部 门 也 建立 了 单独 的 数据 开放 门户 。 例 如 : 新 加 坡 
采用 的 是 统一 数据 门户 网 站 data. gov. sg ,截至 2014 年 2 月 10 日 ,门户 网 站 
上 开放 了 68 个 部 门 的 8733 个 数据 集 , 实 现 了 全 国 范围 内 的 整合 ;美国 的 数 
据 门户 data. gov 在 2014 年 1 月 全 面 改版 ,截至 2014 年 2 月 10 日 ,网 站 上 
共 开 放 了 88 137 个 数据 集 、349 个 应 用 程序 .140 个 移动 应 用 ,参与 的 部 门 达 
到 175 个 。 

除了 在 国家 数据 门户 上 整合 了 部 分 州 、 地 方 政府 的 数据 集 外 ,美国 还 有 
40 个 州 .44 个 县 市 建立 了 单独 的 数据 门户 。 美 国 的 数据 开放 格式 多 达 46 
种 ,其 中 应 用 最 广 的 格式 是 HTML、ZIP 和 XML 三 种 ,数据 集 分 别 有 20 775 
个 .12 517 个 和 11992 个。 英国 除了 全 国 统一 的 数据 门户 网 站 外 ,伦敦 , 曼 
彻 斯 特等 地 以 及 索 尔 福 德 市 议会 等 16 个 地 方 和 部 门 也 建立 了 独立 的 开放 数 
据 门户 。 在 英国 的 数据 开放 门户 网 站 (data. gov. uk) 上 , 共 开 放 了 13 670 个 
公开 的 数据 集 以 及 4170 个 非 公 开 的 数据 集 。 

各 国 开放 的 数据 集 以 CSV, HTML, XLS, NII, PDF 等 一 种 或 多 种 格式 
出 现 。 在 印度 ,目前 使 用 的 是 全 国 统一 的 数据 开放 门户 网 站 (data. gov. in), 
共 开放 了 5811 个 数据 集 , 共 有 58 个 部 门 和 4 个 州 参与 ,开放 了 24 个 应 用 程 
序 ;在 5811 个 数据 集中 ,以 XLS 格式 开放 的 有 1793 个 ,以 ZIP 格式 开放 的 4 
个 ,以 CSV 格式 开放 的 2087 个 ,以 HTML 格式 开放 的 有 30 个 ,以 XML 格 
式 开放 的 有 1897 个 。 

3 围绕 民生 的 地 理 、 交 通 等 领域 最 先 取 得 成 效 


数据 开放 运动 的 一 个 核心 目的 就 是 更 好 地 满足 公众 的 需求 ,通过 政府 
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开放 数据 ,促进 公共 服务 领域 提供 更 好 的 服务 ,通过 政府 数据 的 免费 使 用 来 
带动 创新 ,创造 出 一 些 有 助 于 大 众 更 好 地 适应 现代 生活 的 实用 工具 和 产品 。 

2013 年 6 月 17 一 18 日 ,美国 英国, 法国、 德国 意大利. 加拿大 .日 本 和 
俄罗斯 八国 领导 人 在 英国 北 爱尔兰 厄 恩 湖 举行 了 2013 年 八国 峰会 。 会 议 围 
绕 全 球 经 济 增长 与 就 业 、 开 放 贸 易 、 税 收 体系 、 土 地 交易 、 开 放 数 据 、 粮 食 安 
全 、 气 候 变化 , 反 铠 问题 和 外 交 政 策 等 展开 讨论 ,同意 在 扩大 自由 贸易 打击 
跨国 企业 逃税 避税 、 提 高 政府 和 商业 运作 透明 度 三 个 领域 采取 行动 ,并 发 表 
了 联合 公报 和 声明 。 会 议 期 间 , 八 国 认可 了 《八国 集团 防止 公司 信息 滥用 和 
立法 安排 主要 行动 原则 》, 签 署 了 《八国 集团 开放 数据 宪章 》, 并 将 上 述 两 个 
文件 作为 附件 列 入 联合 公报 。 

《G8 开放 数据 宪章 ) 明 确 了 开放 数据 的 5 大 原则 和 14 个 重点 开放 领域 ， 
其 主要 宗旨 是 推动 政府 更 好 地 向 公众 开放 数据 ,挖掘 政府 拥有 的 公共 数据 
的 经 济 潜力 ,促进 经 济 增长 ,激发 创新 ,以 及 加 强 责任 感 。《G8 开放 数据 完 
章 ) 及 其 技术 附件 的 关键 要 点 请 见 本 书 附 录 B。 

从 各 国 开放 数据 门户 情况 来 看 ,围绕 民生 需求 的 数据 在 开放 数据 中 比 
重 最 高 ,也 颇 受 用 户 欢 迎 ,但 是 民众 关注 的 热点 与 国家 的 社会 体制 和 经 济 发 
展 情 况 密切 相关 。 如 : 美国 新 版 的 数据 开放 门户 ,将 原来 的 金融 \ 企 业 、 农 
业 \ 海 洋 和 安全 等 六 大 类 数据 集 拓展 至 农业 、 消 费 、 教 育 、 能 源 \、 金 融 、 地 球 空 
间 、 全 球 发 展 、. 医 疗 . 就 业 和 技能 .公共 安全 科研. 气候、 企业 .道德 ,法律 、 制 
造 、 海 洋 、 州 .市 .县 等 二 十 大 类 ,与 民生 需求 相关 的 数据 集 普遍 增加 。 

在 加 拿 大 ,下 载 量 最 高 的 十 个 数据 集中 有 九 个 来 自 加 拿 大 公民 身份 与 
移民 局 ,包括 永久 居民 的 申请 流程 和 时 限 、 永 久居 民 的 分 类 、 等 待 中 的 永久 
居民 申请 等 。 在 新 加 坡 ,阅读 量 最 高 的 数据 集 为 人 民 协 会 总 部 ,3G 移动 用 
户 数 、 各 运营 商 3G 移动 通信 服务 平均 速率 。 在 印度 ,下 载 量 最 高 的 数据 集 
为 电子 和 计算 机 科学 的 技术 发 展 、 印 度 国防 研究 与 发 展 组 织 的 热 成 像 产 品 、 
国内 储蓄 及 构成 占 GDP 现价 的 比例 等 数据 集 。 
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2311 交通 领域 


通过 开放 公共 交通 数据 ,政府 将 允许 第 三 方 人 员 使 用 这 些 数据 来 创建 
应 用 程序 ,以 此 改进 市 民 出 行 体验 ;市 民 也 能 够 使 用 开放 数据 报告 基础 设施 
出 现 的 问题 。 许 多 互联 网 企业 正在 做 类 似 的 事情 。 例如; 谷歌 设计 了 
MapMaker, 任 何人 都 可 以 在 谷歌 地 图 上 做 标注 。 基 于 这 款 产 品 形成 了 “在 
线 公 民 制 图 员 联 盟 ”, 花 了 两 个 月 的 时 间 , 就 将 巴基斯坦 地 区 长 达 25 000 多 
千 米 的 未 标注 公路 线 绘制 出 来 了 。 

1. 美国 交通 部 开放 数据 改善 交通 效率 和 安全 性 

提供 大 量 的 业务 服务 ,致力 于 解决 与 国家 运输 系统 相关 的 复杂 安全 问 
题 是 美国 交通 部 的 工作 重点 之 一 。 美 国 交通 部 长 期 以 来 重视 向 公众 公开 数 
据 工作 ,根据 美国 (开放 政府 指令 》 的 要 求 ,该 部 门 先 后 于 2010 年 6 月 和 
2012 年 4 月 制定 发 布 了 第 一 个 (开放 政府 行动 计划 》 和 第 二 个 (开放 政府 行 
动 计 划 》。 美 国 交通 部 已 经 在 Data. gov 门户 网 站 上 发 布 了 765 个 数据 集 或 
工具 及 大 量 的 应 用 。 

美国 交通 部 的 管理 者 意识 到 ,为 了 更 好 地 提供 高 价值 的 数据 ,有 一 些 基 
础 性 问题 必须 通过 内 部 政策 得 到 解决 ,包括 制定 数据 清单 ,选择 合适 的 数据 
进行 发 布 ;研究 决定 如 何 建立 整个 交通 部 范围 内 的 数据 架构 ;以 对 产业 和 个 
人 有 用 的 方式 提供 数据 ,同时 要 遵守 安全 、 隐 私 和 保密 的 相关 规定 ;保持 数 
据 的 质量 ,并 与 利益 相关 者 形成 关于 数据 可 用 性 方面 的 对 话机 制 等 。 

为 积极 应 对 上 述 问题 ,更 好 地 完成 (开放 政府 指令 ) 提 出 的 目标 要 求 , 美 
国 交通 部 主要 采取 了 两 方面 行动 。 
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一 是 组 建 强 有 力 的 工作 团队 。2010 年 ,美国 交通 部 指定 负责 IT 政策 监 
督 的 副 首席 信息 官 为 该 部 负责 开放 政府 的 高 级 负责 官员 ,并 成 立 了 开放 政 
府 工作 组 ,该 工作 组 由 政策 .预算 绩效 ,战略 规划 、 人 力 资源 管理 ,技术 运营 
和 法 律 等 方面 的 专家 组 成 ,其 一 大 任务 是 向 高 级 领导 者 提出 政策 战略 建议 ， 
建立 美国 交通 部 开放 数据 政策 。 

二 是 研究 制定 战略 性 行动 计划 并 积极 推进 实施 。 在 该 部 负责 开放 政府 
高 级 官员 的 带领 下 ,2010 年 6 月 研究 制订 的 第 一 个 开放 政府 行动 计划 成 为 
其 他 机 构 学 习 的 模板 。 该 计划 主要 从 以 下 三 个 维度 推进 工作 。 

(1) 战略 维度 : 在 短期 内 ,要 转变 交通 部 对 信息 发 布 的 态度 ;从 长 远 来 
看 ,要 实现 和 维持 开放 性 。 

(2) 政策 维度 : 提供 确认 数据 集 和 按照 优先 顺序 发 布 的 指导 。 

(3) 目录 清单 : 建立 信息 系统 资源 列表 ,运用 这 些 列表 形成 一 个 完整 的 
数据 集 目录 清单 ,并 按照 优先 次 序 排出 对 外 开放 的 数据 。 

美国 交通 部 在 2012 年 4 月 制订 的 第 二 个 开放 政府 计划 中 确定 了 “安全 
社区 ”旗舰 项 目 , 即 在 Data. gov 门户 网 站 上 开设 安全 社区 版 块 (Safety 
. Data. gov) ,当时 在 该 版 块 中 提供 了 713 个 数据 集 、4 个 移动 应 用 、14 种 资源 
和 公共 软件 工具 和 3 种 挑战 比赛 。2012 年 9 月 ,召开 了 首届 安全 数据 大 型 
论坛 (Safety Datapalooza) ,其 目标 是 运用 大 量 的 安全 相关 的 数据 集 ,通过 挖 
掘 安全 应 用 开发 者 的 创新 .互联 网 的 即时 性 和 政府 收集 的 相关 安全 信息 ,使 
公众 能 够 在 大 量 对 安全 现状 描述 和 影响 将 来 安全 环境 分 析 的 数据 基础 上 ， 
做 出 更 好 的 与 安全 相关 的 决策 ,从 而 提高 美国 公共 安全 水 平和 改善 公共 健 
康 。 美 国 交 通 部 的 开放 数据 及 相关 应 用 如 表 2. 1 所 示 。 

下 面 重点 介绍 两 个 应 用 : 一 是 美国 国家 公路 交通 安全 署 的 SaferCar 
APP, 二 是 航班 延误 时 间 的 分 析 系 统 Flyontime. us. 

1) SaferCar APP 

SaferCar APP 在 美国 国家 公路 交通 安全 署 网 站 SaferCar. gov 上 向 消费 
者 提供 实时 汽车 安全 信息 ,主要 包括 : 


R21 美国 交通 部 开放 数据 及 相关 应 用 


数 据 集 API APP 


铁路 设备 事故 报告 
API ( Rail Equipment 
Accident/Incident Re- 
port API) 


紧急 响应 指南 2012 移动 APP 
(Emergency Response Guidebook 
2012 Mobile APP) 


轮胎 质量 (Tire Quality) 


安全 等 级 (Safety Ratings) 公交 更 安全 APP(SaferBus APP) 


儿童 安全 (Child Safety) 汽车 更 安全 APP(SaferCar APP) 


公路 - n= a s = z 
AA YA A ee EH X S R 
eee at (Roadway Safety Dashboard and 
Grade Crossing Acci-| œ ` ; 
Community of Practice) 


法 律 数据 (Law Data) 


dent/Incident Report 


执行 和 遵守 数据 (Enforce- | APD 
ment &. Compliance Data) 铁路 安全 数据 可 视 化 (Rail Safety 


Data Visualization) 


其 他 数据 
(资料 来 源 : 工业 和 信息 化 部 电子 科学 技术 情报 研究 所 ) 


(1) 5 星 级 安全 汽车 排名 信息 。 考 虑 购买 汽车 的 消费 者 可 以 查找 事故 
测试 排名 , 且 可 在 不 同 品牌 和 车 型 之 间 进 行 对 比 。 

(2) 召回 信息 和 投诉 信息 。APP 用 户 可 预见 可 能 碰 到 的 安全 问题 。 如 
果 发 现 安全 问题 ,消费 者 可 进行 登记 并 由 美国 国家 公路 交通 安全 署 发 布 公 
告 ,从 而 使 消费 者 就 可 能 存在 的 问题 向 美国 国家 公路 交通 安全 署 投诉 更 加 
容易 。 

(3) 提供 安装 小 孩 座 位 帮助 。APP 用 户 可 快速 确定 最 近 的 小 孩 座位 检 
查 地 点 ,并 得 到 相应 帮助 。 

(4) 安全 头条 和 和 警告 信息 。APP 用 户 可 从 美国 国家 公路 交通 安全 署 获 
得 重要 新 闻 和 信息 ,包括 召回 通知 ,并 可 推送 被 记录 汽车 通知 。 消 费 者 可 以 
利用 这 些 数 据 和 信息 做 出 购买 决策 ,确保 购车 安全 .开车 安全 和 维护 安全 
(buy safe. drive safe. stay safe). 


2) Flyontime. us 


Data. gov 上 线 以 后 ,美国 交通 部 开放 了 全 美 航班 起 飞 、 到 达 、 延 误 的 数 
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据 , 有 程序 员 立 刻 利用 这 些 数据 开发 了 一 个 航班 延误 时 间 的 分 析 系 统 
(Flyontime. us)。 该 系统 向 全 社会 免费 开放 ,任何 人 都 可 以 通过 它 查询 ,分 
析 全 国 各 次 航班 的 延误 率 及 机 场 等 候 时 间 。 这 个 系统 上 线 之 后 ,由 于 其 简 
单 、 实 用 ,获得 了 全 美 多 个 新 闻 报 刊 的 报道 和 关注 ,成 为 很 多 人 乘机 、 候 机 的 
行动 指南 。 

以 波士顿 至 纽约 的 航线 为 例 , 用 户 可 以 在 系统 主页 上 通过 机 场 名 称 查 
看 不 同 天 气 .不 同日 期 不 同时 段 . 不 同 航 空 公司 ,不同 航班 等 各 种 条 件 下 飞 
机 是 否 准 时 以 及 平均 延误 时 间 的 数据 明细 。 这 个 简单 的 操作 ,对 消费 者 和 
整个 社会 的 经 济 活动 具有 巨大 的 作用 。 

(1) 帮助 消费 者 找到 表现 最 佳 或 者 最 符合 自己 需要 的 航班 。 如 果 没 有 
这 些 信息 ,消费 者 在 选择 航空 公司 的 时 候 , 信 息 是 不 完全 ,不 充分 的 ,与 航空 
公司 构成 一 种 典型 的 信息 不 对 称 关系 。 航 班 的 历史 数据 很 有 参考 价值 , 公 
开 这 些 信息 ,弥补 了 消费 者 的 信息 不 对 称 。 此 外 ,消费 者 在 对 比分 析 大 量 历 
史 数 据 的 基础 上 ,自己 做 出 判断 ,即使 结果 不 尽 如 人 意 , 也 会 感觉 公平 。 

(2) 最 大 程度 降低 了 旅客 等 待 时 间 的 不 确定 性 。 刁 恶 等 待 ,是 人 之 常 
情 , 因 为 等 待 意 味 着 时 间 流 失 、 经 济 损失 ,不 确定 性 的 等 待 还 往往 导致 精神 
焦虑 。 单 次 航班 的 延误 时 间 似 乎 是 随机 的 、 无 规律 的 ,但 是 , 当 数据 累积 到 
一 定 程度 时 ,航班 延误 时 间 的 长 短 就 会 在 统计 上 呈现 出 一 种 秩序 和 稳定 。 
航班 延误 分 析 系 统 把 这 种 统计 学 上 的 “秩序 和 稳定 ”传达 给 了 旅客 ,帮助 他 
们 建立 正确 的 期 待 ,合理 安排 时 间 , 避 免 焦虑 。 

G) 有 利于 推动 航空 市 场 的 良性 竞争 。 航 班 延误 分 析 系 统 按 平均 延误 
时 间 给 相关 航空 公司 排 了 "座次 ”。 回 到 上 面 的 例子 ,经 营 波士顿 至 纽约 航 
线 的 公司 共有 5 个 。 就 是 否 准点 而 言 , 谁 好 谁 差 , 几 乎 一 目 了 然 。 此 外 ,各 次 
航班 的 表现 也 有 明细 。 例 如 American Eagle 航空 公司 的 第 4617 航班 ,全 年 
共有 182 班次 ,平均 延误 7 分 钟 ; 相 比 之 下 ,该 公司 的 4614 航班 ,全 年 也 是 
182 班次 ,但 平均 提前 8 分 钟 到 达 。 这 些 数据 ,不 仅 是 消费 者 的 行动 指南 ,也 
是 各 大 航空 公司 的 核心 竞争 指标 。 通 过 公开 这 种 数据 ,无 疑 可 以 促进 市 场 


竞争 ,航班 延误 必然 逐渐 下 降 到 消费 者 能 够 接受 的 合理 范围 之 内 。 

其 实 ,为 了 缓解 航班 延误 的 问题 ,美国 政府 也 想 过 同样 的 办 法 。 早 在 
Data. gov 之 前 ,国家 交通 安全 局 就 在 其 网 页 (NSA. gov) 上 提供 过 一 个 “航班 
等 待 时 间 计 算 器 ” ,帮助 旅 客 估计 因 航 班 延误 而 导致 的 等 待 时 间 。2009 年 政 
府 开放 数据 之 后 ,民间 开发 出 来 的 这 一 免费 工具 明显 比 交 通 安全 局 提供 的 
“计算 器 ”功能 更 强大 、 界 面 更 友好 。 很 快 ,该 局 便 关闭 了 这 个 “计算 器 ”, 也 
节省 了 维护 这 一 应 用 的 开支 。 

Flyontime. us 还 能 够 查询 各 个 机 场 安检 通关 的 时 间 , 这 个 数据 也 是 机 
场 服务 质量 的 一 个 重要 指标 。 但 这 部 分 数据 来 源 并 不 是 政府 发 布 的 数据 ， 
而 是 乘客 自己 提交 的 数据 。 候 机 的 乘客 可 以 通过 推 特 (Twitter) 或 者 智能 手 
机 向 该 系统 提交 其 在 某 个 机 场 通过 安全 检查 的 时 间 。 这 些 数据 ,通过 汇总 
和 平均 ,成 为 其 他 用 户 的 参考 。 

伴随 着 Data. gov 的 开放 ,美国 的 航班 延误 率 正在 呈 下 降 趋 势 ,由 2008 
年 的 27% 下 降 到 2009 年 的 20. 8% ,再 到 2010 年 的 20.2%。 数 据 开 放 在 其 
中 的 作用 不 可 小 视 。 

2 旧金山 利用 开放 数据 优化 城市 交通 系统 


美国 旧金山 市 为 公众 提供 了 大 量 的 开放 数据 ,包括 从 停车 计 费 器 到 公 
共 艺 术 表 演 等 信息 ,但 并 不 是 所 有 的 人 都 意识 到 了 这 些 信息 的 作用 。 为 了 
让 民众 进一步 了 解 这 些 开放 数据 的 价值 ,旧金山 市 联合 Kicker Studios 公 
司 , 通 过 对 开放 数据 的 利用 来 优化 城市 的 交通 系统 , 见 图 2. 4。 

Kicker 公司 拥有 大 量 能 够 用 来 处 理 的 公开 数据 ,包括 公车 路 线 、 事 故 报 
告 . 最 快 和 最 安全 的 路 线 以 及 停车 信息 等 。 在 与 旧金山 运输 局 进行 会 谈 之 
后 ,Kicker 公司 发 现 ,公车 信息 更 新 系统 NextBus 中 所 运行 的 日 程 方面 的 数 
据 每 年 只 更 新 四 次 ,这 就 意味 着 每 次 公车 的 延迟 情况 (这 种 情况 其 实 很 常 
见 ) 都 可 能 会 造成 车 次 抵达 时 间 的 偏差 ,而 运输 局 却 没有 中 央 通 信 系 统 , 司 
机 们 只 是 在 工作 结束 之 后 把 这 些 延 误 情况 记录 在 事故 报告 中 就 算 完事 了 。 
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Parade on Market SMS 


图 2.4 Kicker 利用 旧金山 开放 数据 开发 的 应 用 


因此 ,Kicker 公司 建议 使 用 一 个 短信 息 的 界面 来 记录 事故 报告 ,同时 让 司机 
们 来 重新 设 定 自己 的 公车 路 线 。 也 就 是 说 , 当 一 场 球 赛 结束 后 ,民众 对 公车 
的 需求 会 比较 强 , 但 如 果 按 照 原 有 的 路 线 是 不 能 为 当时 所 有 等 车 的 人 提供 
运输 服务 的 。 而 针对 陈旧 的 公车 调度 系统 ,Kicker 公司 也 提出 了 一 个 非常 
全 面 的 解决 方案 ,界面 上 包括 实时 的 交通 
信息 和 正常 的 公车 路 线 , 可 以 在 公车 进 
前 对 其 到 达 时 间 进 行 更 好 的 预 估 。 同 时 ， 
该 界面 还 允许 用 户 丰 富 公 交 车 的 相关 信 
息 ,比如 在 14 号 线 上 有 一 位 喜欢 吵架 的 乘 
客 之 类 的 信息 。 

图 2.5 中 显示 的 是 Kicker 公司 开发 的 
应 用 中 一 个 基于 手机 或 网 络 的 用 户 界面 ， 
它 能 够 展示 距离 自己 最 近 的 公交 线路 、 下 
一 班车 到 来 的 时 间 、 出 租车 最 多 的 线路 (有 
时 候 出 租车 是 很 难 找到 的 ) 和 最 佳 的 骑 车 图 2.5 Kicker 公 司 开发 的 应 用 
路 线 等 。 此 外 ,该 界面 还 能 够 告知 用 户 最 用 户 界面 


省 钱 和 最 省 时 的 交通 方式 。 所 有 这 些 服务 都 需要 用 到 开放 数据 。 

3. 移动 应 用 ShotHero 组 解 多 个 城市 停车 难 问 题 

SpotHero 是 一 个 手机 应 用 ,支持 iOS 和 Android 手机 ,能够 实时 跟踪 人 
网 城市 的 停车 位 数量 变化 ,用 户 只 需要 输入 地 址 或 者 在 地 图 中 选 定 地 点 ,就 
能 看 到 附近 可 用 的 车 库 或 停车 位 以 及 价格 和 时 间 区 间 。 目 前 它 已 经 能 够 实 
时 监控 包括 华盛顿 .纽约 .芝加哥 .巴尔 的 摩 、. 波 士 顿 、 密 尔 沃 基 和 纽 瓦 克 七 
个 城市 的 停车 位 。 

4 莽 加 哥 市 推出 "领养 "人 行道 的 应 用 


芝加哥 市 推出 了 “领养 * 人 行道 的 应 用 ,市 民 志愿 者 将 在 大 雪 天 为 自己 
领养 的 人 行道 清除 积 雪 ,不 仅 方便 居民 出 行 ,而 且 减 轻 了 市 政 开支 。 

5 里 昂 市 用 交通 数据 治 墙 

2013 年 IBM 的 研究 者 与 法 国 里 昂 市 合作 开发 了 能 缓解 道路 拥堵 的 决 
策 支持 系统 优化 器 (Decision Support System Optimizer, DSSO), 基 于 实时 
交通 报告 来 侦 测 和 预测 拥堵 。 若 交管 人 员 发 现 某 地 即将 发 生 交通 拥堵 ,就 stable 
可 以 及 时 调整 信号 灯 让 车 流 以 最 高 效率 运行 。 这 个 系统 对 于 突 发 事件 也 很 
有 用 ,例如 帮助 救护 车 尽快 到 达 医 院 。 随 着 运行 时 间 的 积累 ,这 套 系统 还 能 
够 “学 习 ” 过 去 的 成 功 处 置 方 案 , 并 运用 到 未 来 预测 中 。 

6 浙江 某 市 利用 大 数据 改善 交通 管理 

浙江 省 某 市 经 济 发 展 迅 猛 ,地 方 交通 越 来 越 繁 忙 ,机 动车 辆 不 断 增 加 ， 
经 过 几 年 交通 信息 化 的 发 展 ,已 经 陆续 接 入 了 100 多 套 智 能 监控 卡 口 系统 、 
300 多 套 卡 口 式 电子 警察 及 500 余 路 视频 监控 。 地 方 交通 部 门 采用 了 数据 
驱动 的 方法 ,在 市 内 重要 检查 点 安装 了 上 千 台 数字 监控 设备 ,这 些 设备 每 周 
7X24 小 时 不 间断 地 捕获 图 像 和 视频 数据 ,每 月 数据 量 达 TB 级 。 这 些 数据 
采集 设备 获取 的 结构 化 数据 ,例如 : 时 间 、 地 点 .车 辆 信息 等 集中 存储 在 市 交 上 E 
通 支队 数据 中 心 ,而 图 片 和 视频 等 半 结 构 化 数据 存储 在 各 县 数据 中 心 。 当 | 
地 交通 部 门面 临 着 如 何 有 效 利 用 这 些 不 断 增加 的 交通 信息 数据 改进 交通 管 57 
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理 的 挑战 。 

(1) 集中 管理 交通 数据 : 集中 访问 分 散 存储 在 不 同 的 支队 数据 中 心 的 
图 像 或 视频 等 交通 数据 和 道路 交通 管理 设施 .装备 及 应 用 系统 等 。 

(2) 优化 海量 数据 利用 : 提供 尽 可 能 长 时 间 段 的 车 辆 监控 数据 为 市 公 
安治 安 、 刑 侦 、 经 侦 部 门人 员 及 一 线 民警 等 提供 信息 支撑 服务 。 

(3) 改善 交通 : 提高 对 各 种 交通 突 发 事件 的 应 急 调度 能 力 ,依据 历史 数 
据 预 测 交通 或 突 发 事件 的 趋势 。 

其 解决 方案 主要 包括 三 个 方面 : 

(1) 部 署 统一 的 交通 数据 中 心 : 通过 22 台 服 务 器 、198TB 的 存储 空间 
对 数字 交通 信息 实现 集中 存储 。 

(2) 部 署 Apache Hadoop 软件 : 利用 Hadoop 分 布 式 文件 系统 
(Hadoop Distributed File System, HDFS) 和 Apache HBase 实现 基础 过 车 
结构 化 数据 的 永久 存储 以 及 最 近 24 个 月 的 交通 违法 图 像 数 据 ,实时 检索 数 
据 ,并 可 随时 无 缝 扩容。 

(3) 部 署 城 道 重点 车 辆 动态 监管 系统 : 发 挥 开 放 数 据 分 析 平 台 的 优势 ， 
实现 海量 数据 的 挖掘 和 分 析 。 

以 上 方案 取得 了 显著 的 效果 : 

(1) 提升 了 交通 案件 侦破 能 力 。 机 动车 违法 图 像 信 息 在 系统 的 保存 周 
期 从 3 个 月 延长 到 24 个 月 ,交通 警察 等 部 门 可 根据 车 辆 的 颜色 .车 型 .号 牌 
等 信息 实时 查询 其 历史 行为 、 行 车 路 线 和 车 辆 营运 公司 .驾驶 人 等 关联 
信息 。 

(2) 增强 了 交通 警察 对 机 动车 辆 的 监管 能 力 。 交 警 可 以 从 24 亿 条 过 车 
数据 中 轻松 检索 被 监测 机 动车 的 号 牌 ,精确 查询 行车 轨迹 。 

(3) 便捷 利用 关联 车 辆 的 分 析 数 据 。 针 对 24 亿 条 实际 过 车 数据 进行 
两 卡 点 、 多 卡 点 的 伴随 车 辆 和 碰撞 车 辆 的 复杂 分 析 ,查询 耗 时 仅 为 10 秒 
左右 。 


2312 医疗 领域 


开放 医疗 数据 可 以 帮助 实现 类 似 大 规模 流行 病 分 析 这 样 的 研究 ,并 产 
生 实 质 性 的 突破 成 果 。 在 这 个 过 程 中 ,需要 严格 制定 措施 ,确保 病人 的 隐私 
权利 。 例 如 ,可 以 向 研究 人 员 开 放出 生 时 的 健康 状况 登记 ,人 允许 医生 通过 追 
踪 丰富 的 信息 ,发 现 环境 因素 对 人 体 健 康 的 影响 。 谷 歌 流 感 趋势 (Google 
Flu Trends) 数 据 已 经 展示 了 通信 连接 和 规模 化 两 者 结合 可 以 改变 我 们 对 某 
种 已 知 病毒 的 了 解 ,几乎 不 用 再 分 享 和 核对 信息 。 

简单 地 集中 管理 数据 并 将 其 向 研究 人 员 和 临床 医生 开放 ,就 已 足够 医 
疗 人 员 开 发 出 可 更 好 地 了 解 和 治疗 疾病 的 新 模型 ,医疗 保健 机 构 通 过 将 病 
人 的 健康 记录 电子 化 及 隐私 化 ,同时 为 医生 、 保 险 公司 ` 相 关 部 门 和 病人 开 
放 数据 ,可 以 产生 更 大 的 价值 。 各 种 数据 与 电子 病历 记录 相连 接 又 可 挖掘 
出 新 数据 ,包括 病人 满意 度 调查 、 医 生 的 临床 笔记 以 及 磁 共 振 的 图 像 数 据 
等 。 健 身 和 健康 追踪 器 产生 的 大 量 数据 看 似 有 趣 , 但 个 人 很 难 从 中 搜集 到 
有 意义 的 东西 ;然而 ,当成 千 上 万 人 的 数据 被 用 于 挖掘 与 健康 结果 相关 的 信 
号 和 链接 时 ,这 些 数据 就 可 能 发 挥 作 用 ,比如 可 被 用 作 预 防 疾病 或 及 早 检测 
到 疾病 的 新 方法 。 

美国 食品 及 药品 管理 局 (FDA) 正 在 为 某 些 药 物 发 行 标签 ,为 经 历 某 种 
基因 变异 的 病人 注 明 不 同 摄 入 剂量 (或 解释 为 何某 些 病 人 不 能 服用 该 药 
物 )。 这 预示 着 未 来 可 能 实行 更 多 个 性 化 的 用 药 措施 。 医 院 开 始 使 用 的 
Clipmerge 软件 更 便于 医生 进行 快速 查找 ,同时 , 当 电 子 医疗 记录 表单 上 的 
药物 可 能 发 生 相互 作用 时 ,也 能 及 时 通知 医生 。 

1. 美国 卫生 和 公众 服务 部 


美国 卫生 和 公众 服务 部 是 美国 政府 最 大 的 卫生 保障 机 构 , 是 美国 医疗 
系统 的 官方 最 高 管理 机 构 ,基本 职能 是 保护 国民 身体 健康 ,提供 最 基本 的 医 
疗 卫 生 服 务 。 该 部 非常 重视 开放 数据 工作 ,是 第 一 批发 布 机 读 版 数据 目录 
的 联邦 政府 行政 部 门 之 一 。 该 部 于 2010 年 6 月 发 布 了 第 一 个 (开放 政府 计 
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划 》, 从 领导 治理 与 文化 变革 、 透 明 、 参 与 和 协作 、 旗 舰 行动 4 个 方面 进行 了 详 
细 计 划 ,提出 了 5 大 旗舰 项 目 和 80 多 项 专门 工作 ,并 且 在 hhs. gov/open 网 
站 上 周期 性 地 发 布 实施 进展 情况 ,如 表 2.2 所 示 。2012 年 4 月 ,该 部 又 正式 
发 布 了 第 二 个 《开放 政府 计划 》( 计 划 于 2013 一 2014 年 完成 ) ,在 第 一 阶段 工 
作 基 础 上 又 明确 了 3 大 旗舰 项 目 和 60 多 项 专门 工作 ,并 增加 了 “智能 发 布 ” 
和 “大 数据 ”的 两 个 专门 项 目 。 截 至 2012 年 4 月 ,美国 卫生 和 公众 服务 部 已 
经 在 Data. gov 网 站 上 提供 了 300 多 个 数据 集 和 工具 。 在 第 一 个 开放 政府 计 
划 中 提出 的 里 程 碑 要 求 都 已 实现 或 超过 ,正在 以 新 的 方式 带 给 公众 更 多 的 
收益 。 美 国 卫 生 和 公众 服务 部 于 2009 年 成 立 了 创新 委员 会 ,主要 负责 协调 
和 监督 该 部 的 (开放 政府 计划 》, 推 进 该 部 朝 着 更 加 透明 、 参 与 和 协作 的 方向 
努力 。 美 国 卫生 和 公众 服务 部 还 成 立 了 一 个 包括 创新 委员 会 成 员 的 工作 
组 ,定期 评估 信息 获取 方面 的 工作 。 该 部 在 开放 数据 工作 中 注重 公众 参与 和 
协作 ,自从 发 布 第 一 个 《开放 政府 计划 ) 以 来 ,已 经 组 织 了 50 多 个 挑战 性 竞赛 ， 
以 吸引 公众 参与 到 问题 讨论 和 解决 方案 的 建设 中 来 。 
表 2.2 美国 卫生 和 公众 服务 部 (开放 政府 计划 ) 中 的 旗舰 项 目 
(a) HHS( 开 放 政 府 计划 1.0) 中 的 旗舰 项 目 


1 医疗 保险 和 医疗 补助 展示 中 心 (Centers for Medicare & Medicaid Dashboards) 


2 | 食品 和 药品 管理 局 透明 度 行动 计划 (FDA Transparency Initiative) 


食品 和 药品 管理 局 透明 度 、 结 果 、 责 任 、 信 誉 .知识 共享 计划 FDA-TRACK 


(Transparency-Results-Accountability-Credibility-Knowledge-sharing) 


4 | 蓝 色 按 钮 行动 计划 (“Blue Button” Initiative) 


5 | 社区 健康 卫生 数据 行动 计划 (Community Health Data Initiative) 
b) HHS( 开 放 政府 计划 2.0) 中 的 旗舰 项 目 
1 创新 团队 项 目 (Innovation Fellows Program) 


旨 在 提高 医疗 创新 的 新 合作 项 目 (New Collaborations to Promote Medical 


Products Innovation) 


3 | 提高 数据 质量 和 可 用 性 (Enhanced Data Quality and Usability) 
(资料 来 源 : 工业 和 信息 化 部 电子 科学 技术 情报 研究 所 ) 


下 面 重点 介绍 两 个 重要 项 目 : 一 是 健康 指数 仓库 ,二 是 健康 卫生 数据 行 


动 计划 。 

1) 健康 指数 仓库 (Health Indicators Warehouse) 

数据 指数 仓库 旨 在 提供 一 个 有 关 国 家 、 州 和 社区 健康 指数 的 单一 、 界 面 
友好 的 数据 来 源 , 满 足 多 人 口 健康 行动 的 需要 ,作为 数据 港 为 健康 公共 卫生 
数据 行动 计划 提供 服务 。 数 据 指数 仓库 项 目 由 美国 健康 统计 中 心 ( 美 国 卫 
生 统 计 中 心 ) 开 发 维护 ,提供 数据 支持 和 资金 协作 的 部 门 有 美国 医疗 保健 和 
医疗 补助 服务 中 心 美国 卫生 和 公众 服务 部 副 部 长 办 公 室 、 青 少年 健康 办 公 
室 ,疾病 预防 和 健康 促进 办 公 室 、 少 数 民族 健康 办 公 室 、 计 划 和 评估 助理 部 
长 办 公 室 。 可 从 该 项 目 网 站 上 分 主题 (如 疾病 条件、 年 龄 等 ) .地理 ( 州 、 郡 、 
医院 等 ) 和 行动 角度 获取 相关 数据 。2013 年 6 月 1 日 ,该 网 站 发 布 了 最 新 版 
(1.7 版 ) ,提供 1215 个 指数 。 

2) 健康 卫生 数据 行动 计划 (Health Data Initiative) 

该 项 目 原名 为 社区 健康 卫生 数据 行动 计划 (Community Health Data 
Initiative) ,后 改名 为 健康 卫生 数据 行动 计划 (Health Data Initiative, HDD. 
是 美国 卫生 和 公众 服务 部 开放 政府 中 的 一 个 主要 的 成 功 项 目 , 其 核心 工作 
是 提供 中 央 数 据 资源 ,以 帮助 新 的 数据 用 户 确认 可 以 创造 新 应 用 和 服务 的 
数据 。HDI 由 美国 医学 研究 所 .美国 卫生 和 公众 服务 部 在 一 个 会 议 后 于 
2010 年 联合 发 起 ,该 会 议 的 参 会 代表 包括 来 自 联邦 政府 部 门 、 学 术 机 构 、 社 
会 领域 .公共 卫生 社区 ,信息 技术 公司 、 主 要 业务 企业 和 保健 实施 系统 的 领 
导 。 目 前 ,健康 卫生 数据 行动 计划 已 组 建 了 联盟 , 现 有 17 个 单位 会 员 , 并 设 
有 联盟 网 站 。 该 项 目的 目标 不 仅 要 有 效 配置 数据 ,而 且 要 引发 创新 和 对 那 

应 用 的 使 用 ,该 项 目 通 过 公私 合作 ,鼓励 创新 者 应 用 健康 卫生 数据 开发 
各 种 应 用 ,提高 健康 卫生 意识 和 改善 健康 卫生 成 效 , 激 励 改 善 健康 卫生 的 社 
区 行动 ,帮助 美国 民众 更 好 地 理解 健康 卫生 和 所 在 社区 的 健康 卫生 保健 实 
施 情 况 。 该 项 目 开 展 的 工作 有 : 美国 卫生 和 公众 服务 部 发 布 大 量 更 加 可 用 
的 健康 卫生 数据 ,软件 开发 者 使 用 健康 卫生 数据 开发 新 的 应 用 , 随 着 数据 的 
不 断 改善 和 新 应 用 的 不 断 开发 ,消费 者 ,社区 和 服务 提供 者 在 疾病 预防 、 健 
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康 卫生 促进 、 保 健 质 量 提高 等 方面 取得 了 新 的 成 效 。 该 项 目 已 扩展 到 许多 
州 和 地 方 政府 的 社区 。 美 国 卫生 和 公众 服务 部 门 在 倡导 建立 数据 使 用 者 和 
提供 者 这 一 生态 系统 方面 发 挥 了 重要 的 领导 作用 ,这 个 生态 系统 为 改善 政 
策 制定 者 .公众 、 健 康 医 疗 专 家 、 研 究 者 和 其 他 人 员 的 决策 创造 了 价值 。 
Healthdata. gov 网 站 为 创新 者 生态 系统 提供 一 站 式 资 源 ,这 些 创 新 者 将 数 
据 转 换 成 新 的 应 用 、 服 务 和 观点 ,帮助 人 们 改善 健康 。 该 网 站 的 用 户 能 够 免 
费 获 得 与 健康 相关 的 数据 ,查找 与 健康 相关 的 创新 ,并 可 与 其 他 创新 者 联 
系 ,通过 网 站 上 的 专门 栏目 咨询 有 关 数 据 集 的 专门 问题 ,通过 应 用 程序 接口 
获取 所 有 的 数据 集 目录 。 

健康 卫生 数据 行动 计划 每 年 举行 一 次 名 为 "Health Data Palooza” 的 大 
型 医疗 卫生 数据 行动 年 度 论坛 ,为 数据 使 用 者 .数据 拥有 者 、 开 发 者 .风险 投 
资 .政府 和 企业 提供 交流 如 何 挖掘 数据 潜力 的 机 会 。2013 年 6 月 3 一 4 日 在 
华盛顿 举办 的 第 三 届 论 坛 内 容 丰 富 , 包 括 产 业界 和 政府 官员 的 重要 讲话 , 数 
据 使 用 的 专题 讨论 ,50 多 家 单位 的 新 应 用 展示 (App Demo) ,由 开发 者 .诊所 
和 技术 专家 参加 的 额度 为 2. 5 万 美元 的 编码 比赛 (Health Code-a-Palooza) , 
以 及 发 布 联盟 下 一 步 将 开展 的 重要 行动 计划 和 项 目 ,宣布 挑战 比赛 的 获胜 
者 和 即将 发 布 的 数据 集 等 。 

健康 卫生 数据 行动 计划 正在 采取 的 措施 主要 包括 : 

(1) 向 公众 免费 提供 来 自 联 邦 、 州 .地 区 和 和 郡 的 有 关 保 健 、 卫 生 和 医疗 成 
效 的 数据 ,这 些 数据 没有 知识 产权 限制 ,容易 获取 ,具有 标准 化 、 结 构 化 的 特 
点 ,其 中 有 年 龄 性别、 种 族 、 收 入 的 数据 ,也 有 来 自 医疗 保险 和 医疗 补助 服 
务 中 心 的 关于 疾病 质量、 费用 等 的 数据 ,以 及 以 前 从 未 发 布 过 的 数据 。 

(2) 与 技术 公司 、 研 究 人 员 卫生 提 倡 者 ,媒体 、 消 费 倡导 者 市 场 人 员 等 
进行 广泛 的 沟通 交流 ,帮助 激励 民间 领袖 和 公众 改善 公共 卫生 的 状况 。 

具有 潜力 的 案例 有 : 

(1) 交互 式 医疗 卫生 地 图 ,使 公众 能 够 方便 、 清 晰 地 了 解 其 所 在 地 区 与 
其 他 地 区 的 医疗 卫生 情况 的 比较 。 


(2)“ 排 行 榜 ”使 市 长 和 其 他 民间 领袖 能 够 跟踪 和 了 解 当 地 医疗 卫生 现 
状 和 存在 的 问题 。 

(3) 社交 网 络 应 用 能 使 医疗 卫生 领导 者 与 其 他 人 员 互 相 联系 ,比较 成 
效 ,共享 实践 经 验 。 

(4) 在 线 游戏 能 够 帮助 教育 民众 了 解 社区 医疗 卫生 情况 。 

(5) PatientsLikeMe( 像 我 一 样 的 患者 ) 是 一 个 社交 网 络 医 疗 站 ,建立 在 
美国 医疗 服务 部 (US Department of Health Services) 的 开放 数据 之 上 ,可 让 
潜在 患者 有 机 会 及 早 发 现 病情 ,也 可 让 更 多 病人 互相 分 享 信息 ,彼此 交流 病 
症 情况 。 

2 西 泰山 医疗 中 心 

西奈 山 医疗 中 心 是 美国 历史 最 悠久 、 规 模 最 大 的 教学 型 医院 之 一 ,其 在 
医学 教育 与 生物 医学 研究 方面 的 地 位 非常 突出 。 目 前 该 中 心 正 利用 来 自 大 
数据 新 兴 企 业 Ayasdi 公司 的 技术 对 整个 大 肠 杆 菌 基 因 组 序列 进行 分 析 , 其 
中 包括 超过 100 万 个 DNA 变异 , 旨 在 努力 理解 某 些 菌株 如 何在 与 抗生素 的 
共处 中 获得 抗 药性 。 细 菌 的 抗 药性 影响 着 全 球 各 地 数 以 百 万 计 的 病人 。 
Ayasdi 的 技术 为 数学 研究 .拓扑 数据 分 析 ( 简 称 TDA) 开 辟 了 一 片 新 天 地 ， 
有 助 于 人 们 更 深刻 地 理解 数据 形态 。 西 奈 山 医疗 中 心 的 目标 是 用 这 些 方法 
为 多 种 疾病 的 病人 进行 个 性 化 诊断 和 治疗 ,比如 癌症 和 糖尿 病 病 人 等 ,以 及 
改善 医院 对 病人 的 护理 情况 。 

在 预测 方面 ,西奈 山 医疗 中 心 已 经 将 名 为 PACT 的 预测 模型 内 置 于 电 
子 医 疗 记录 系统 ,用 以 预测 出 院 病 人 90 天 内 返回 医院 的 可 能 性 (新 卫生 保健 
法 为 医院 提供 了 某 些 财政 奖励 ,以 减少 90 天 内 病人 的 再 入 院 率 )。 根 据 预 
测 ,医疗 中 心 的 高 风险 病人 或 许 将 真正 获得 不 同 的 护理 ,比如 为 他 们 分 配 一 
个 治疗 后 协调 员 。 

3 数据 开放 造就 医生 图 谱 

在 ZocDoc, Healthgrades, Vitals, Yelp 中 虽然 可 以 找到 医生 在 病人 中 的 
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口碑 ,但 是 ,病人 对 医生 的 评价 毕竟 还 是 会 存在 一 定 的 片面 性 和 主观 性 。 如 
果 一 位 医生 在 其 他 医生 中 的 口碑 也 不 错 的 话 , 那 这 位 医生 应 该 就 错 不 了 。 

自称 为 “黑客 活动 家 ”的 Fred Trotter 通过 FOIA( 信 息 自 由 法 案 ) 申 请 
到 了 数 百 万 份 美国 联邦 医疗 保险 (Medicare) 的 医生 推荐 数据 ,然后 将 这 些 原 
始 数据 提供 给 Medstartr 大 众 融 资 活动 的 支持 者 ,成 功 募集 到 1. 5 亿美 元 。 
他 还 发 动 了 将 当前 数据 集 与 男 一 个 数据 集 进行 合并 的 活动 ,以 打造 “医生 
图 谱 ”。 

2012 年 11 H, 医 患 网 络 初创 企业 HealthTap 发 布 了 一 项 名 为 
DOConnect 的 新 功能 ,该 功能 将 HealthTap 自身 的 医生 数据 ( 约 17 000 名 医 
生 ) 与 Trotter 拿 到 的 联邦 医疗 保险 医生 推荐 数据 等 结合 起 来 ,为 病人 展现 
出 一 个 全 新 视角 的 医生 互信 网 络 。 

此 项 功能 可 以 让 病人 了 解 到 250 万 名 医生 的 推荐 关系 ,每 一 名 医生 的 关 
系 和 位 置 可 尽 收 眼底 。 这 些 信息 可 以 帮助 病人 在 搜索 医生 和 专家 时 做 出 决 
定 , 同 时 也 可 以 让 医生 有 机 会 建立 一 个 反映 其 线 下 网 络 的 在 线 网 络 。 

Trotter 的 目标 是 创建 一 套 病人 感觉 有 用 、 医 生 认 为 公平 的 排名 算法 , 同 
时 也 希望 学 术 机 构 .医疗 政策 专家 、 创 业者 能 够 利用 这 套 东 西 来 提高 医疗 保 
健 的 整体 透明 度 。 


2313 教育 领域 


目前 全 世界 的 教师 和 大 学 机 构 正 在 以 免费 开放 版 权 的 形式 提供 高 质量 
的 教育 内 容 。 更 重要 的 是 ,偏远 地 区 的 人 们 使 用 这 些 内 容 也 越 来 越 方便 了 ， 
带宽 和 通信 连接 打破 了 社会 体系 中 一 直 存 在 的 教育 壁垒 。 

1. 意大利 教育 部 

意大利 教育 部 、 大 学 以 及 研究 机 构 针对 CC-BY 协议 成 立 了 自己 的 开放 
数据 门户 网 站 ,公开 了 意大利 的 学 校 ( 如 地 址 .电话 号 码 、 网 站 ,行政 代码 )、 
学 生 ( 如 人数 .性别 . 表 现 等 ) 和 教师 (如 数量 ,性别 .退休 等 ) 等 相关 内 容 , 旨 


在 将 所 有 的 数据 开放 使 其 得 到 更 透明 公开 的 再 利用 。 此 举 将 有 助 于 意大利 
学 校 教育 系统 更 好 地 被 公众 认可 ,同时 为 学 生 、 教 师 和 家 庭 提 供 更 好 的 
服务 。 

2“ 爹 球 教育 伙伴 ”开放 数据 以 评估 教育 进步 

“全 球 教育 伙伴 ”(Global Partnership for Education, GPE) 组 织 开 始 于 
2002 年 的 “全 民 教 育 -快速 跟踪 计划 ”(Education for All-Fast Track 
Initiative. EFA FTD ,致力 于 让 所 有 儿童 都 走 进 学 校 接 受 优质 教育 的 多 边 合 
作 。 在 过 去 十 几 年 中 ,GPE 已 经 从 7 个 成 员 国 发 展 到 接近 60 个 成 员 国 , 调 
BT 35 亿美 元 扩大 教育 机 会 与 提高 教育 质量 ,已 帮助 2300 万 儿童 第 一 时 间 
重 返 校园 ,同时 支持 了 37000 间 教 室 的 新 建 并 培训 了 41. 3 万 教师 。 其 成 员 
国 68% 的 女童 现在 都 完成 了 小 学 教育 ,其 中 18 个 成 员 国 实现 了 入 学 机 会 的 
性 别 平等 。 

2013 年 5 月 ,GPE 宣布 启动 “开放 数据 计划 ”, 第 一 批 29 个 成 员 国 数据 
在 线 免 费 开放 ,第 二 批 25 个 国家 的 数据 在 2013 年 年 底 开 放 。 开 放 的 所 有 数 
据 都 是 从 淹没 在 GPE 发 展 中 国家 成 员 伙 伴 的 教育 部 门 计划 、 相 关 部 门 总 结 
文件 .GPE 贷款 申请 ,以 及 由 GEP 合作 伙伴 ,如 联合 国教 科 文 组 织 与 世界 银 
行 提供 的 数据 中 总 结 提炼 出 来 ,所 有 开放 的 数据 都 有 原始 来 源 ,在 注解 中 还 
具体 说 明了 其 背景 和 界定 以 及 获取 数据 的 方法 。 数 据 分 6 个 教育 大 类 共 57 
项 指标 。 六 大 类 包括 : 关键 教育 产 出 与 目标 ;国内 、 外 部 与 GPE 资助 ;学 习 
结果 ,尤其 是 阅读 与 数学 评估 ;地 方 教育 团体 的 构成 与 发 展 伙伴 ;教育 部 门 
援助 的 效率 。 

作为 监测 与 评价 战略 的 一 部 分 ,GPE 开发 这 一 在 线 数据 库 的 目的 是 对 
每 一 个 GPE 成 员 国 的 教育 目标 与 实际 结果 进行 比较 ,显示 这 些 国 家 政府 在 
让 更 多 儿童 走 进 学校 、 提 高 女童 人 学 机 会 以 及 增加 教师 数量 方面 取得 的 进 
步 ,同时 帮助 这 些 国家 评价 其 进步 情况 ,并 制定 基于 证 据 的 计划 解决 儿童 教 
育 问题 。 
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GPE 认为 ,数据 的 免费 使 用 将 带 来 巨大 变化 ,并 有 助 于 提高 成 绩 并 影响 
决策 制定 ,还 能 有 效 刺激 成 员 国 增强 该 国 的 统计 系统 。 

3. 美国 教育 数据 计划 

美国 政府 于 2012 年 6 月 初 启动 了 “教育 数据 计划 ”, 旨 在 帮助 学 生 及 其 
家 庭 从 基于 开放 数据 的 创新 中 获 益 。2012 年 7 月 上 旬 , 美 国 白宫 、 美 国教 育 
部 和 乔治 华盛顿 大 学 商学 院 联 合 召 开 了 “教育 数据 困境 ”(Education Data 
Jam) 研 讨 会 ,各 界 教育 技术 专家 和 企业 汇聚 一 堂 , 就 如 何 利用 开放 教育 数据 
开发 新 的 应 用 、 产 品 、 服 务 及 产品 功能 ,促进 学 生成 才 展开 讨论 ,借助 “我 的 
数据 计划 ”(My Data Initiative) 鼓 励 拥有 学 生 数 据 的 学 校 , 软 件 厂 商 和 其 他 
机 构 将 这 些 数据 以 电子 .机 器 可 读 的 格式 提供 给 家 长 和 学 生 , 使 学 生 能 随时 
掌握 自己 的 学 习 概 况 ,获取 个 性 化 学 习 体验 ,方便 他 们 更 理智 地 选择 学 校 和 
财政 资助 。 

4 MOOC 教 育 模式 


全 球 不 断 兴 起 的 大 规模 开放 式 在 线 课程 (Massive Open Online 
Courses, MOOC) 教 育 模式 ,也 是 开放 数据 革新 教育 行业 的 另 一 例证 。 例 如 : 
Khan Academy 在 线 网 站 有 超过 3000 份 教学 视频 ,涵盖 各 个 方面 ,从 物理 课 
程 到 金融 学 指南 等 不 一 而 足 。 全 世界 的 人 都 可 以 使 用 这 个 不 断 增 长 的 资源 
库 , 或 者 贡献 自己 的 内 容 。 通 过 这 一 平台 ,孟买 的 学 生 可 以 通过 手机 获得 
MIT 最 顶级 的 课程 ,甚至 成 为 一 名 教师 ,上 传 自己 的 教学 视频 。 


232 城市 大 数据 的 协同 应 用 


在 政府 信息 资源 开发 利用 方面 ,世界 上 许多 城市 已 经 率先 开始 行动 。 
“开源 城市 ”已 经 不 仅仅 是 互联 网 时 代 对 知情 权 的 迫切 需要 , 它 已 成 为 政府 
治理 方式 的 革新 手段 。 

1. 基于 媒体 报道 的 China AidData 项 目 


中 国 对 非洲 援助 一 直 以 来 都 是 个 饱 受 争议 的 问题 ,而 在 这 长 达 60 年 的 


资助 历史 中 ,中 国 对 非洲 到 底 援 助 了 多 少 金额 ,可 能 没有 多 少 人 搞 清 楚 过 。 
致力 于 国际 援助 款 透 明 化 与 开放 化 的 研究 机 构 AidData 在 2012 年 起 便 针 对 
这 个 问题 展开 了 研究 。 

由 于 中 国 官方 并 未 采用 一 些 国 际 援助 款 登 记 平台 ,如 经 济 合作 与 发 展 
组 织 (Organization for Economic Cooperation and Development, OECD) 的 
CRS 或 者 国际 援助 款 透 明 计 划 (IATI) 的 援助 款 数 据 平台 ,因此 AidData 无 
法 通过 搜索 这 些 现 有 的 数据 库 来 获取 所 有 援助 款 数 据 。AidData 在 这 个 项 
目 中 便 采 用 了 一 种 基于 媒体 报道 的 数据 采集 方式 : 通过 对 不 同 中 外 媒体 源 
例如 维基 解密 (WikiLeaks)、BBC 的 相关 报道 进行 挖掘 与 整理 , AidData 研 
究 员 成 功 搜集 了 大 量 官方 公开 或 未 公开 的 对 非 援 助 项 目 以 及 金额 数据 ,从 
而 形成 了 China. AidData 的 数据 库 。2000 一 2011 年 中 国 对 非 年 度 援助 金额 
分 布 如 图 2.6 所 示 。 


2000 年 2011 年 


ga 
eat 
tif ; 


B 2.6 2000—2011 年 中 国 对 非 年 度 援助 金额 分 布 


AidData 在 这 个 项 目 中 证 明了 基于 媒体 报道 的 数据 采集 方式 是 一 个 很 
好 的 解密 非 公 开 援助 款项 目的 手段 。 例 如 ,非洲 马 拉 维 作为 中 国 的 受 援助 
对 象 在 其 官方 系统 中 仅 公布 了 两 项 中 国 援助 计划 ,但 通过 挖掘 不 同 媒体 报 
道 ,AidData 成 功 地 将 额外 14 个 总 值 163 万 美金 的 中 国 援助 项 目 公开 , 进 一 
步 将 中 国 对 非 援助 计划 透明 化 。 

AidData 的 数据 库 目 前 赛 括 了 2000—2011 年 间 中 国资 助 50 个 非洲 国 
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家 的 1673 个 项 目 , 项 目 总 值 达 750 亿美 元 。 为 了 便于 记者 、 研 究 人 员 、 政 策 
制定 人 员 等 访问 这 些 数据 ,AidData 创建 了 项 目 网 站 china. aiddata. org 提供 
数据 的 查询 访问. 下载 以 及 可 视 化 。 同 时 ,为 了 提升 数据 的 质量 以 及 持续 
追踪 中 国 对 非 援助 项 目 , 网 站 也 接受 用 户 提 交 的 新 信息 .例如 照片 文件、 媒 
体 报道 .视频 等 。 

LARS WF: 把 整个 城市 报 上 GtHb 

GitHub 是 一 个 代码 托管 网 站 ,但 与 过 往 许多 代码 托管 网 站 不 同 的 地 方 
在 于 ,其 提供 了 充分 “开放 ”的 工作 模式 。 它 鼓励 任何 人 对 一 个 公开 的 代码 
库 进行 “复制 ”从 而 对 原 有 代码 进行 修改 、 扩 展 , 改 正 ,同时 , 它 也 充分 鼓励 任 
何人 参与 项 目的 讨论 ,可 以 新 开 一 个 “ 工 单 ” 来 提出 问题 ,汇报 Bug, 建 议 新 增 
功能 。 正 是 这 样 “ 开 放 "的 模式 使 其 成 为 程序 员 界 最 重要 的 工具 和 社区 。 

在 2013 年 2 月 ,芝加哥 市 政府 决定 将 其 整个 城市 的 数据 上 传 至 
GitHub, 并 鼓励 所 有 人 来 复制 "它们 的 数据 ,帮助 它们 提升 数据 的 质量 或 者 
利用 这 些 数 据 做 出 创新 的 应 用 。 这 是 自 2009 年 奥巴马 政府 宣布 全 国 开 展开 
放 数 据 运 动 及 英国 成 立 开 放 数 据 研究 所 以 来 ,开放 数据 领域 的 又 一 模式 
创新 。 

如 果 说 将 数据 放 在 开放 门户 提供 民众 下 载 是 开放 数据 1. 0, 那 么 将 数据 
放 在 GitHub 这 样 一 个 鼓励 开放 协作 的 平台 就 是 进入 了 开放 数据 2.0。 开 放 
协作 使 得 数据 能 够 像 代码 一 样 被 "复制 ?并 由 社区 来 提升 质量 ,而 这 就 提供 
了 一 个 “发 布 者 -使 用 者 ”之 间 的 双向 通道 来 进一步 帮助 城市 管理 者 将 数据 化 
为 真正 有 用 的 资源 ,这 是 仅 将 数据 开放 下 载 所 不 能 达到 的 效果 。 

3 开放 的 城市 服务 热线 : 从 FixWyStreet 到 Open311 

FixMyStreet 是 英国 民间 非 营 利 机 构 MySociety 推出 的 第 一 款 产品 ,也 
是 首 款 在 城市 服务 领域 内 引入 开放 模型 的 应 用 。 往 常 ,对 于 公共 设施 比如 
路 面 、 街 道路 灯 等 的 报修 以 及 其 他 城市 服务 的 投诉 都 是 单 向 . 单 人 的 沟通 ， 
这 也 就 造成 了 问题 的 重复 投诉 率 高 .处 理 进 度 不 透明 等 问题 。 而 


FixMyStreet 首次 引入 了 开放 模型 ,将 单 向 . 单 人 的 沟通 改造 成 双向 多 人 的 
沟通 模式 ,允许 多 人 集中 对 一 个 问题 进行 投诉 ,并 提供 平台 对 有 关 部 门 的 处 
理 进度 进行 追踪 。 

例如 英国 南安 普 敦 市 市 民 向 市 政府 投诉 有 路 障 倒 地 阻碍 了 人 行道 ,地 
图 上 标记 了 准确 的 问题 地 点 ,次 日 早上 市 府 便 立 刻 回复 说 该 问题 已 登记 在 
案 , 并 且 在 问题 解决 后 ,立刻 再 次 回复 让 公众 知情 。 

这 样 的 开放 模型 在 解决 城市 服务 问题 中 有 着 众多 的 优点 。 首 先 ,这 样 
的 开放 模型 更 容易 吸引 人 参与 到 城市 问题 的 投诉 中 。 对 于 如 今 的 手机 党 、 
微 博 党 、 微 信和 党 而 言 ,简单 地 在 地 图 上 点 点 , 写 上 两 句 话 ,要 比 一 本 正经 地 挨 
打 热 线 电 话 更 容易 。 其 次 ,沟通 成 本 会 更 低 。 传 统 的 热线 电话 方式 ,使 得 单 
一 问题 的 投诉 重复 率 大 大 增加 ,而 开放 模式 则 使 得 单一 问题 能 够 由 多 人 同 
时 参与 ,这 也 就 减轻 了 相关 部 门 在 接受 问题 投诉 上 所 付出 的 时 间 和 人 力 成 
本 ,避免 资源 浪费 在 同一 问题 上 。 最 后 ,采用 开放 模型 是 政府 树立 良好 形象 
的 极 佳 途径 。 开 放 模型 不 仅 是 将 工作 流程 开放 ,人 允许 更 多 民众 参与 ,更 是 对 
信息 的 透明 化 : 政府 何 时 受理 该 问题 ,是 否 持续 跟 进 ,是 否 已 解决 问题 等 信 
息 都 通过 一 个 透明 化 的 渠道 让 公众 知情 ,而 这 也 能 更 好 地 塑造 一 个 透明 ZS 
开 的 政府 形象 。 

FixMyStreet 的 成 功 ,引爆 了 一 场 民 间 对 城市 服务 热线 改造 的 风潮 。 各 
种 类 型 的 类 似 产品 在 各 个 国家 、 城 市 相继 推出 ,民众 的 参与 热情 一 度 高 涨 ， 
但 随 之 产生 的 问题 也 越 来 越 多 。 首 先 ,民间 自行 开发 的 类 似 产 品 虽 然 可 以 
吸引 民众 参与 ,但 是 有 时 候 却 无 法 保证 政府 的 参与 。 其 次 ,由 于 产品 过 多 ， 
政府 不 可 能 在 所 有 产品 上 同时 跟 进 问题 ,这 反而 降低 了 政府 效率 。 最 后 , 因 
为 每 个 人 采用 的 产品 很 可 能 不 同 , 因 此 投诉 的 重复 率 问 题 又 回来 了 ,因为 民 
众 的 注意 力 被 不 同 产品 分 散 了 。 

为 了 解决 这 些 问题 ,Open311 诞生 了 。Open311 本 身 并 不 是 一 个 新 的 
App; 而 是 一 个 供 第 三 方 应 用 与 政府 的 城市 服务 热线 进行 数据 交换 的 API 
标准 。 它 所 制定 的 标准 确保 了 各 个 地 方 政府 采用 统一 的 接口 来 供 第 三 方 产 
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品 使 用 ,这 样 就 确保 了 所 有 第 三 方 应 用 都 能 通过 统一 的 渠道 将 数据 反馈 到 
政府 机 构 。 同 时 第 三 方 应 用 之 间 也 就 有 了 统一 的 接口 来 交换 以 及 同步 数 
据 , 从 而 解决 了 上 文 提 到 的 由 于 产品 过 多 ,民众 的 注意 力 被 分 散 的 问题 。 

更 为 重要 的 是 ,Open311 制定 的 API 标准 使 得 城市 服务 热线 的 数据 得 
以 真正 开放 。 而 此 类 数据 对 于 城市 规划 等 问题 是 极为 重要 的 。2010 年 ， 
Wired 就 曾经 从 纽约 的 NYC 311 服务 里 私下 获取 过 近 百 万 311 电话 的 数 
据 , 并 就 此 制作 了 可 视 化 图 表 进 行 数据 分 析 。 而 现在 有 了 Open311 协议 , 通 
过 开放 的 渠道 来 完整 取得 相关 的 数据 就 不 再 是 问题 了 。 

Open311 脱胎 于 美国 城市 服务 热线 311, 但 它 本 身 不 仅 是 一 个 美国 的 标 
准 , 而 是 期 望 成 为 一 个 国际 标准 。 目 前 除了 美国 的 城市 比如 纽约 ,芝加哥 之 
外 ,还 有 英国 南安 普 敦 、 巴 尼 特 ,芬兰 赫尔辛基 等 城市 采用 了 Open311 的 
API 标 准 。 

4 用 众 包 的 LocalData 和 Streetmix 设 计 城市 

城市 规划 听 上 去 好 像 是 一 件 离 老 百姓 很 远 的 事情 ,但 如 果 政 府 采 用 开 
放 模 型 来 重新 组 织 城市 规划 活动 ,那么 普通 民众 也 能 参与 其 中 ,并 且 还 能 出 
其 不 意 地 帮助 城市 规划 部 门 提升 效率 。 如 城市 规划 的 前 期 调研 ,规划 机 构 
往往 需要 耗费 大 量 人 力 成 本 和 时 间 成 本 来 收集 详细 的 城区 地 块 数据 。 而 这 
一 过 程 如 果 能 够 让 熟悉 这 一 地 块 的 民众 来 协助 , 则 会 事半功倍 。2012 年 , 美 
国 Code for America 的 一 批 成 员 (Fellow) 在 和 底特律 市 合作 过 程 中 , 便 意 识 
到 了 这 个 城市 规划 中 收集 数据 的 难题 ,进而 开发 了 一 款 新 的 应 用 
LocalData。LocalData 引入 开放 模型 的 理念 ,由 规划 部 门 来 设 定 详细 的 问 
题 ,而 民众 则 可 以 通过 实地 考察 ,然后 在 手机 应 用 上 录入 数据 回答 问题 。 

这 种 众 包 的 思路 在 不 同 的 美国 城市 都 取得 了 极为 难得 的 成 绩 。 例 如 ， 
印第安 纳 州 的 格雷 市 从 20 世纪 60 年 代 起 就 面临 着 人 口 衰减 的 问题 ,如 今 整 
座 城 市 到 处 都 是 空 宅 无 人 居住 ,市 政府 有 意 将 一 些 空 宅 拆除 另 做 开发 ,但 又 
缺乏 翔实 的 数据 来 确定 需要 拆除 的 建筑 范围 .于 是 LocalData 便 成 为 解决 这 


一 问题 的 关键 。 通 过 市 政府 和 芝加哥 大 学 公共 政策 学 院 的 合作 与 协调 , 4 
地 67 名 志愿 者 调查 了 市 内 2000 英亩 的 11 651 幢 房 屋 。 而 调研 的 结果 通过 
LocalData 的 可 视 化 功能 直观 地 展现 给 决策 者 ,让 他 们 了 解 空房 的 密度 、 空 
间 分 布 情况 等 , 极 大 地 方便 了 拆除 计划 的 制订 。 

普通 民众 的 参与 方式 当然 不 仅仅 局 限于 做 这 些 数据 的 收集 工作 。 
Streetmix 是 另 一 个 由 Code for America 的 成 员 制作 的 应 用 , 旨 在 释放 人 们 
对 自己 城市 街道 的 想象 力 ,用 简单 的 网 页 应 用 ,通过 拖 忠 页 面 元 素 ,设计 出 
自己 心目 中 的 街道 。 而 人 们 对 某 一 街道 的 设计 ,又 能 通过 该 平台 汇总 产生 
统计 数据 ,例如 “70% 的 设计 中 包含 了 一 条 自行 车 道 ”, 那 么 决策 者 便 能 更 好 
地 决定 是 否 要 在 新 街道 规划 中 预 留 出 一 条 自行 车 道 以 及 具体 如 何 设 计 它 。 
这 一 应 用 一 经 推出 , 便 受 到 了 民众 的 广泛 欢迎 。 因 为 它 本 身 简单 易 用 ,很 多 
人 便 把 它 作 为 简易 版 的 “模拟 城市 ”游戏 来 尽情 发 挥 想象 力 。 例 如 ,一 位 网 
民 制 作 的 Streetmix 街道 图 就 展现 了 把 整 条 街 都 占领 当 作 自 行车 道 的 “ 霸 
气 ” 设 想 。 

5, 加 利 福 尼 亚 州 SD 优化 电网 运行 


加 州 独立 系统 运营 商 (简称 ISO) 管 理 着 全 加 州 地 区 超过 八成 电网 中 的 
供电 走向 ,每 年 提供 的 电力 达到 2. 89 亿 千 万 时 ,惠及 3500 万 民众 ,供电 线路 
的 总 长 度 超过 25000 英里 。 他 们 利用 Space-Time Insight 公司 的 软件 实现 
情景 智能 化 机 制 , 从 而 将 多 个 来 源 的 大 规模 数据 进行 关联 与 分 析 , 其 中 包括 
天 气 状况 ,传感器 数据 以 及 计量 设备 测绘 结果 等 ,并 以 可 视 化 形式 帮助 用 户 
查看 及 理解 如 何 对 可 再 生 能 源 进行 优化 ,实现 整个 电网 的 电力 供需 平衡 以 
便 快速 应 对 潜在 危机 。 

6 拉 斯 维 加 斯 市 构建 实时 公共 事业 网 络 模 型 

由 于 记录 太 过 古老 ,信息 不 够 准确 ,大 部 分 城市 中 的 公共 事业 机 构 都 不 
了 解 埋 在 地 下 的 资产 处 于 何 种 状况 一 一 因此 居民 往往 会 由 于 某 条 供电 线 被 
意外 切断 或 者 某 条 供水 管线 老化 爆裂 而 受到 影响 。 为 了 解决 这 些 难 题 , 拉 
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斯 维 加 斯 市 采取 智能 数据 方式 开发 出 一 套 实 时 公共 事业 网 络 模型 。VTN 
咨询 公司 帮助 市 政 当局 通过 各 种 渠道 汇总 数据 ,并 利用 Autodesk 技术 创建 
出 实时 3D 模型 。 这 套 模 型 中 包含 着 地 上 与 地 下 的 所 有 公共 设施 ,目前 已 经 
被 用 于 监测 城市 地 下 设施 的 具体 位 置 以 及 运转 状况 。 

7 迈阿密 市 属 戴 德 县 使 用 情报 仪表 板 节省 开支 

佛罗里达 州 迈阿密 市 属 戴 德 县 希望 将 35 个 区 域 自治 单位 与 迈阿密 市 聚 
拢 起 来 ,努力 帮助 政府 领导 做 出 更 为 明智 的 管理 决策 一 一 包括 充分 利用 水 
资源 ,减少 交通 拥堵 以 及 改善 公众 安全 等 。IBM 通过 云 计 算 环 境 下 的 深层 
分 析 为 该 县 带 来 一 套 情 报 仪 表 板 , 从 而 帮助 各 机 关 与 部 门 彼此 协作 并 实现 
可 视 化 管理 。 举 例 来 说 , 戴 德 县 公园 部 门 2013 年 预计 将 通过 识别 并 修复 因 
锈蚀 而 漏水 的 浇灌 管道 节省 100 万 美元 经 费 。 

8 西雅图 市 使 用 公有 云 、 类 数据 实现 节能 措施 


西雅图 市 最 近 与 微软 和 埃 森 哲 试点 大 数据 节能 项 目 。 该 项 目 基 于 微软 
的 Azure 云 计算 平台 ,可 收集 和 分 析 来 自 四 个 城区 建筑 管理 系统 的 数 百 个 
数据 集 。 通 过 预测 分 析 工 具 ,大 数据 系统 将 能 找 出 可 行 的 节能 措施 ,目标 是 
将 耗 电量 降低 25%。 

9 波士顿 鼓励 个 人 "领养 "消防 检 减 轻 市 政 负 担 

波士顿 的 冬天 积 雪 很 厚 ,2013 年 1 月 份 波士顿 新 城区 办 公 室 发 布 了 一 

款 名 为 “领养 消防 栓 ? 的 应 用 。 根 据 哈佛 商学 院 博客 ,该 项 目 在 地 图 上 标注 

了 全 市 13 000 个 消防 栓 的 位 置 ,市 民 可 以 申请 "领养 "一 个 或 多 个 消防 栓 ,并 
承诺 在 大 雪 天 负责 将 自己 领养 消防 栓 从 积 雪 中 挖 出 来 。 完 成 “领养 "手续 
后 ,志愿 者 将 在 消防 栓 被 雪 埋 时 收 到 消息 通知 。 


多 源 信息 协同 的 标准 、 模 式 与 架构 


智慧 城市 是 一 个 开放 的 复杂 巨 系 统 ,城市 系统 本 身 与 系统 
周围 的 环境 有 物质 .能量 和 信息 的 交换 ,同时 城市 系统 下 又 包含 
数量 庞大 、 种 类 繁多 的 子 系 统 。 信 息 协 同 是 保障 城市 系统 中 其 
他 资源 要 素 优化 配置 的 基础 ,也 是 城市 系统 更 加 智慧 运行 的 
前 提 。 
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第 3 章 ”群体 级 和 区 域 级 的 多 源 信息 协同 


以 个 体 为 单位 ,多 源 信息 协同 是 实现 群体 一 致 性 行动 的 基础 。 以 群体 
为 单位 ,多 源 信息 协同 则 是 实现 组 织 联动 的 基础 。 本 章 分 别 以 群体 决策 和 
城市 管理 为 例 ,对 群体 级 的 多 源 信息 协同 和 区 域 级 的 多 源 信息 协同 进行 介 
绍 ;在 此 基础 上 ,介绍 智慧 城市 多 源 信息 协同 体系 的 理论 框架 。 

智慧 城市 是 一 个 不 断 演 进 的 过 程 ,通过 多 源 信息 的 协同 将 数据 的 采集 
与 业务 应 用 分 离 ,在 决策 单元 分 散 化 的 基础 上 破解 信息 碎片 化 的 难题 ,逐步 
实现 物体 的 智能 化 流程 的 智能 化 和 服务 的 智能 化 ,最 终 实现 从 “控制 ?到 
“智能 ”的 转变 。 


31 面向 群体 决策 的 多 源 信息 协同 


在 现实 生活 中 ,决策 往往 是 群体 行为 ,是 由 多 人 参加 进行 行动 方案 选择 
的 活动 ,如 各 种 委员 会 .董事 会 ,代表 大 会 等 均 属于 群体 决策 机 构 。 这 些 组 
织 的 成 员 或 代表 均 是 群体 决策 者 中 的 一 员 。 以 群体 行为 做 出 的 决策 ,在 决 
策 程序 ,决策 评价 标准 上 与 单个 决策 者 的 决策 有 很 大 的 差异 ,在 决策 原则 、 
方法 .许多 方面 都 有 新 的 内 容 . 因 而 应 用 单个 决策 者 的 决策 方法 进行 群体 决 
策 在 许多 方面 都 受到 了 限制 。 

群体 决策 (group decision) 研 究 的 是 一 个 群体 如 何 共 同 进行 一 项 联合 行 
动 抉 择 。 联 合 行动 抉择 一 般 有 两 种 情况 : 一 是 各 个 决策 成 员 参 与 同一 行动 ， 
如 公司 董事 会 对 投资 项 目的 决策 ;二 是 各 成 员 参 与 但 不 行动 ,如 作为 买方 企 
业 和 作为 卖方 企业 ,一 方 是 购买 行动 , 男 一 方 是 销售 行动 ,只 有 同时 做 出 决 
策 后 ,双方 的 行动 才能 付 诸 实 施 。 群 体 决策 研究 的 目的 和 单个 决策 者 的 情 
况 一 样 ,是 描述 群体 决策 行为 的 机 理 以 及 分 析 群 体 应 如 何 进行 有 效 的 决策 ， 


即 相 应 分 为 描述 性 研究 和 规范 性 研究 。 

群体 决策 理论 研究 的 问题 一 般 具 有 三 个 前 提 : 

Q) 自主 性 。 决 策 者 有 独立 的 选择 机 会 ,其 行动 不 受 较 高 层 权力 支配 ， 
但 不 排除 群体 成 员 的 相互 影响 。 

(2) 共存 性 。 决 策 成 员 都 在 已 知 的 共同 条 件 下 进行 选择 。 一 部 分 成 员 
未 作出 选择 的 情况 下 ,其 他 成 员 的 决策 行动 不 能 说 最 后 完成 。 群 体 决策 不 
能 在 撤 开 一 部 分 成 员 的 条 件 下 去 完成 。 

G) 共 意 性 。 群 体 作出 的 必然 是 所 有 参与 者 一 致 能 接受 的 方案 。 然 而 ， 
这 并 不 意味 着 所 有 参与 者 都 认定 此 方案 最 优 。 有 的 成 员 也 可 能 持 反对 态 
度 ,但 面临 集体 的 最 后 决策 而 不 得 不 作出 妥协 和 认可 。 

群体 中 的 决策 问题 并 不 都 具有 群体 决策 上 述 特 点 。 企 业 一 般 属于 序 组 
织 结构 ,下 属 若干 车 间 主 任 , 车 间 主 任 领导 若干 工段 长 等 。 下 属 的 目标 从 上 
级 目标 派生 出 来 并 受 上 级 的 监督 控制 ,下 级 服从 上 级 , 常 无 自主 性 。 层 序 组 
织 的 领导 决策 实际 上 是 个 人 决策 。 当 然 , 各 级 领导 在 决策 之 前 ,各 层次 、 甚 
至 夹层 次 的 成 员 也 参与 此 决策 过 程 ,不 过 只 是 参与 ,最 后 判断 和 取舍 则 完全 bl 
是 领导 的 个 人 行为 。 自 主 、 共 存 、 共 意 并 非 群体 决策 过 程 的 必要 条 件 。 要 求 
所 研究 的 群体 决策 问题 具备 上 述 特点 ,只 不 过 是 说 明 目 前 群体 决策 理论 的 
局 限 性 。 

群体 决策 研究 与 个 人 决策 研究 相 比 ,问题 要 复杂 得 多 。 这 主要 由 于 以 
下 几 个 因素 引起 : 

(1) 偏好 程度 。 和 群体 的 每 个 成 员 都 有 各 自 的 目标 和 优先 观念 以 及 不 同 
的 效用 函数 。 某 些 情 况 下 成 员 偏 好 程度 完全 一 致 ;而 另 一 些 情况 下 成 员 则 
有 相互 对 立 的 偏好 程度 ,对 方 的 收益 成 为 自己 的 受 损 。 这 是 两 种 极端 的 情 
况 。 大 量 的 情况 是 在 群体 中 既 有 一 致 又 有 矛盾 的 优先 观念 ,群体 中 各 成 员 
间 偏 好 程度 的 矛盾 强度 影响 着 决策 方式 。 

(2) 主观 概率 判断 。 群 体 中 各 成 员 由 于 信息 的 感受 和 处 理 方式 不 一 样 ， 
对 未 来 状态 出 现 概率 的 估计 也 不 同 。 这 直接 影响 着 方案 的 选择 。 75 
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(3) 沟通 。 和 群体 决策 可 以 在 事先 完全 没有 沟通 信息 的 情况 下 进行 ,在 沟 
通过 程 中 ,相互 交流 各 自 的 目标 、 偏 好 程度 及 对 未 来 事件 的 判断 ,以 影响 对 
方 的 认识 和 弥补 自己 掌握 信息 的 不 足 。 

(4) 人 数 。 指 群体 中 参与 决策 的 人 数 。 是 两 人 ,三 人 还 是 更 多 成 员 参 与 
决策 ? 这 都 直接 影响 群体 决策 过 程 的 机 理 。 一 个 部 门 、 一 个 组 织 总 是 通过 
代表 和 其 他 部 门 和 组 织 共 同 进行 某 项 决策 。 因 而 ,群体 决策 也 研究 多 组 织 
间 进 行 的 联合 决策 。 


311 群体 决策 的 基本 概念 与 方法 


1. 群体 决策 与 个 体 决策 

群体 决策 的 理论 建立 在 个 体 决策 理论 的 基础 之 上 ,因此 ,个 体 决 策 理论 
假设 也 是 群体 决策 假设 ,如 对 决策 者 理性 的 假设 .偏好 的 传递 性 要 求 等 。 除 
此 之 外 ,群体 决策 由 于 是 多 个 决策 者 共同 对 问题 作出 决策 , 它 又 有 自己 的 特 
点 。 与 个 体 决 策 比 较 ,群体 决策 对 问题 的 认 知 和 处 理 等 方面 存在 着 以 下 的 
不 同 点 。 

CL) 任何 个 体 决 策 者 都 难以 作出 完美 的 决策 ,都 可 能 会 犯错 误 。 这 说 明 
决策 充满 着 风险 和 不 确定 性 。 

(2) 至 少 有 两 名 决策 者 需要 共同 负责 决策 。 

(3) 群体 决策 一 般 来 说 是 非 结构 化 的 复杂 决策 问题 。 这 说 明 群 体 决策 
需要 解决 的 问题 往往 庞大 而 又 复杂 ,单个 决策 者 的 知识 和 精力 都 有 限 ,难以 
作出 令 人 满意 的 决策 ,需要 集中 群体 决策 者 集体 的 智慧 才能 创造 性 地 解决 
问题 。 

(4) 群体 决策 的 结果 应 该 是 个 体 决策 者 的 偏好 形成 一 致 或 妥协 之 后 得 
出 的 , 即 Pareto 原则 。 这 说 明 的 是 尽管 决策 是 有 风险 的 ,但 通过 个 体 偏好 的 
一 致 集结 ,汇集 各 方面 的 信息 ,又 可 以 减少 决策 带 来 的 风险 和 不 确定 性 。 

(5) 群体 决策 质量 受 所 采用 的 决策 规则 影响 。 


(6) 群体 决策 质量 受 个 体 和 群体 的 关系 影响 。 

2 关于 群体 决策 的 几 种 定义 

群体 决策 已 经 成 为 数学 ,政治 学 .经济 学 .社会 心理 学 .行为 科学 ,管理 
学 和 决策 科学 等 多 门 学 科研 究 的 共同 交叉 点 。 不 同学 科 对 群体 决策 研究 的 
侧重 点 不 同 , 导 致 形成 了 群体 决策 复杂 多 变 的 名 词 术 语 。 由 于 群体 决策 问 
题 具有 内 在 复杂 性 及 众多 学 科 交 叉 的 特性 ,而 且 研 究 者 进行 研究 的 角度 不 
同 , 从 而 形成 了 群体 决策 各 种 各 样 的 研究 模型 ,也 正 因 如 此 ,至 今 群 体 决策 
电 没 有 一 种 被 广泛 接受 的 统一 定义 。 

Hwang 在 1978 年 对 群体 决策 进行 分 析 和 总 结 后 ,给 出 了 一 个 群体 决策 
的 定义 , 即 群体 决策 是 把 不 同 成 员 关 于 方案 集合 中 方案 的 偏好 按 某 种 规则 
集结 为 决策 群体 的 一 致 或 妥协 的 群体 偏好 序 。Hwang 的 定义 实际 上 更 多 地 
刻画 出 规范 性 群体 决策 的 一 些 特征 , 即 需要 寻找 一 种 对 决策 群体 公平 的 规 
则 对 个 体 决策 者 的 偏好 进行 集结 。 这 个 定义 强调 了 群体 决策 过 程 是 寻找 每 
个 决策 个 体 都 能 够 认可 的 群体 效用 函数 。 这 个 过 程 看 起 来 是 一 个 静态 过 
程 ,而 实际 上 ,个 体 决 策 者 在 形成 最 终 的 一 致 或 妥协 的 群体 决策 过 程 是 一 个 
非常 复杂 的 过 程 ,有 可 能 这 个 决策 个 体 意 见 的 一 致 或 妥协 过 程 不 得 不 反复 
进行 直至 决策 者 群体 的 一 致 偏好 最 终 得 以 形成 。 

陈 班 是 这 样 定义 群体 决策 的 : 群 是 由 群众 选 出 的 代表 组 成 的 各 种 各 样 
的 委员 会 ,群体 决策 是 集中 群 中 各 成 员 的 意见 以 形成 群 的 意见 。 这 个 定义 
与 Hwang 定义 比较 相近 。 

Luce 和 Raiffa 认为 群体 决策 问题 是 定义 一 个 “公平 ”的 方法 集结 个 体 偏 
好 类 型 以 至 于 产生 由 这 些 个 体 组 成 的 社会 唯一 的 偏好 类 型 。 能 够 产生 这 样 
唯一 的 偏好 方法 有 很 多 ,但 并 不 是 都 是 “公平 "的 。 群 体 决策 研究 者 的 目的 
是 找 出 这 种 “公平 ”的 集结 方法 。 由 此 看 出 ,这 个 定义 的 重点 是 集结 方法 的 

莞 华 认 为 : 群体 决策 是 研究 多 人 如 何 作 出 统一 的 有 效 抉择 。 多 个 个 


FENA RASDS AMHR NFIF Wa 


77 


HM UBER SHS+ SSMS 4S— AS e EE 


78 


体 组 成 群体 ,个 体 间 可 能 合作 ,也 可 能 竞争 ,还 可 以 是 复杂 联合 的 以 及 合作 
基础 上 的 有 限 竞 争 等 ,但 必须 作出 统一 的 决策 行为 。 

不 同 的 研究 者 出 于 不 同 的 研究 视角 ,给 出 了 不 同 的 群体 决策 定义 。 

3 群体 决策 的 基本 假设 


群体 决策 的 理论 建立 在 个 体 决策 理论 的 基础 上 ,因此 个 体 决 策 理论 假 
设 也 是 群体 决策 假设 ,如 对 决策 者 理性 的 假设 、 偏 好 的 传递 性 要 求 等 。 群 体 
决策 由 多 个 决策 者 共同 对 问题 作出 决策 , 它 又 有 自己 的 一 些 特点 。 不 同 的 
研究 者 由 于 研究 的 目的 不 同 ,对 群体 决策 研究 的 假设 也 不 同 。 

群体 决策 一 般 存在 以 下 基本 假设 。 

假设 1: 任何 个 体 决策 者 难以 作出 完美 决策 ,都 可 能 会 犯错 误 。 假设 1 
说 明 个 体 决策 者 在 作出 决策 时 ,存在 着 犯错 误 的 可 能 性 ,因此 决策 充满 着 风 
险 和 不 确定 性 。 

假设 2: 至 少 有 两 名 决策 者 需要 共同 负责 决策 。 假 设 2 是 群体 决策 区 别 
于 个 体 决策 的 根本 所 在 ,由 于 决策 者 需要 共同 负责 进行 决策 ,决策 者 的 个 数 
和 决策 者 之 间 的 本 质 关 系 直接 影响 到 群体 决策 的 决策 过 程 . 决 策 机 理 以 及 
决策 结果 的 质量 。 委 员 会 决策 .组 织 决策 以 及 团队 决策 都 是 由 于 决策 者 之 
间 的 关系 不 同 而 导出 的 群体 决策 形式 。 

假设 3: 群体 决策 一 般 来 说 是 非 结构 化 的 复杂 决策 问题 。 假 设 3 指出 群 
体 决 策 需 要 解决 的 问题 往往 庞大 而 且 复杂 ,单个 决策 者 的 知识 和 精力 都 极 
为 有 限 ,难以 作出 令 人 满意 的 决策 ,需要 集中 群体 决策 者 集体 的 智慧 才能 创 
造 性 地 解决 问题 。 

假设 4: 群体 决策 的 结果 应 该 是 个 体 决 策 者 的 偏好 形成 一 致 或 妥协 之 
后 得 出 的 , 即 Pareto 原则 。 由 假设 1 可 知 ,决策 是 有 风险 和 不 确定 性 的 。 正 
是 通过 对 个 体 偏好 的 一 致 集结 ,得 到 来 自 不 同 来 源 的 信息 , 才 大 大 减少 了 决 
策 带 来 的 风险 和 不 确定 性 。 

假设 5: 群体 决策 质量 受到 所 采用 的 决策 规则 的 影响 。 给 定 群 体 决策 


其 他 因素 不 变 , 所 采用 的 决策 规则 不 同 会 得 出 不 同 的 决策 结果 。 当 采用 不 
同 的 决策 规则 时 ,每 个 备 择 方案 都 有 机 会 成 为 最 终 的 方案 ,深刻 地 说 明了 决 
策 规则 对 群体 决策 质量 的 影响 。 

假设 6: 群体 决策 质量 受 个 体 和 群体 关系 的 影响 。 假 设 6 说 明 决策 个 体 
对 群体 的 忠诚 度 对 群体 决策 具有 影响 。 

4 群体 决策 的 主要 方法 

1) 机 器 学 习 法 

对 大 量 的 历史 数据 和 决策 过 程 中 积累 的 经 验 进 行 分 析 和 处 理 以 获得 对 
决策 有 用 的 知识 ,主要 包括 : CART 学 习 算 法 、 神 经 网 路 .遗传 算法 .粗糙 集 
理论 .基于 范例 的 推理 等 。 

2) 软 计算 法 

软 计算 法 其 目的 在 于 适应 现实 世界 普遍 存在 的 不 确定 性 , 它 是 一 个 方 
法 的 集合 。 其 指导 原则 是 开拓 对 不 精确 .不 确定 性 和 部 分 真实 的 确认 和 表 
示 , 以 达到 可 处 理性 、 鲁 棒 性 、 低 成 本 求解 以 及 与 现实 更 好 紧密 联系 的 目的 。 

3) 数据 仓库 和 联机 分 析 处 理 (OLAP) 

数据 仓库 通过 多 数据 源 信息 的 提取 ,转化 、 净 化、 汇总 ,建立 面向 主题 、 
集成 .时 变 、 持 久 的 数据 集合 ,从 而 为 决策 提供 依据 。OLAP 是 与 数据 仓库 
相关 联 的 数据 分 析 技 术 , 它 通过 对 数据 仓库 的 即席 、 多 维 、 复 杂 查 询 和 综合 
分 析 , 得 出 隐藏 在 数据 中 的 事物 的 特征 与 发 展 规律 ,为 决策 提供 支持 。 

4) 定性 推理 法 

定性 推理 理论 由 于 其 处 理 不 完全 ,不 确定 知识 和 模糊 数据 的 突出 能 力 ， 
在 管理 科学 等 领域 受到 了 关注 。 定 性 推理 的 理论 和 方法 被 应 用 于 预测 、 分 
析 、 控 制 和 辅助 决策 。 

这 些 理论 和 方法 的 运用 在 很 大 程度 上 突破 了 传统 方法 的 局 限 性 ,提高 
了 决策 问题 求解 的 效能 和 决策 的 智能 化 水 平 ,为 群体 决策 支持 系统 (Group 
Decision Support System,GDSS) 的 实现 奠定 了 良好 的 方法 和 理论 基础 。 
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31.2 群体 决策 的 协同 方法 


在 群体 决策 过 程 中 ,一 般 先 由 各 决策 者 分 别 做 出 自己 的 判断 即 评价 , 然 
后 再 将 这 些 判断 信息 按照 某 种 方法 协同 (集结 ) 成 为 群体 决策 结果 , 即 最 终 
的 决策 。 因 此 ,群体 决策 过 程 涉及 个 体 评价 和 群体 决策 两 个 阶段 。 关 于 群 
体 决 策 问题 的 个 体 评价 方法 请 读者 自行 查阅 相关 专业 书籍 中 的 多 属性 决策 
方法 ,下 面 主要 总 结 群 体 决策 问题 的 协同 (集结 ) 方 法 。 

按照 某 种 算法 对 单个 评价 进行 集结 ,得 到 一 个 总 体 评价 , 称 为 群 评价 问 
题 。 群 评价 的 集结 方法 也 因 具 体 问 题 而 不 同 ,总 体 上 可 以 分 为 两 类 , 即 评价 
值 的 集结 和 评价 序 的 集结 , 见 表 3. 1。 下 面 分 别 对 每 种 方法 进行 简要 介绍 。 


表 3.1 群体 决策 问题 的 协同 方法 


协同 类 型 协同 方法 

加 权 平 均 法 

基于 评价 值 的 协同 算术 平均 法 
中 间 值 法 

线性 分 配 法 
基于 评价 序 的 协同 平均 值 法 
Borda 数 


1. 基于 评价 值 的 协同 


设 ”个 决策 者 分 别 给 出 对 方案 ; 的 评价 值 v;, 求 群 评价 值 z 的 算法 , 即 
为 评价 值 的 协同 方法 。 

1) 评价 值 协 同 的 最 优 法 则 

对 于 被 评价 对 象 来 讲 , 其 本 身 有 一 个 真实 值 或 客观 的 合理 值 ,评价 值 的 
最 优 法 则 应 是 评价 值 与 真实 值 尽 可 能 接近 。 

假定 决策 者 给 出 的 评价 值 vi, 与 真实 值 vo 的 差 是 随机 变量 ,其 均值 为 
OTH o 时 , 且 相互 独立 , 取 群 评价 值 z 为 六 的 某 种 加 权 平 均 , 即 


Hho < w, < Dw A 
则 也 是 随机 变量 ,其 均值 为 ww, 方差 为 


m 
= > w oi 


要 使 了 尽 可 能 接近 w ,就 要 使 5? 尽 可 能 小 , 即 取 


ming? = > w;:?0;? 


利用 该 方法 解 此 最 小 化 问题 得 ww = Ma = M30 EXA = 


六 点 .由 此 ,评价 值 集结 的 最 优 法 则 可 描述 为 如 果 决策 者 ii = 1,2,…， 


n) 的 评价 值 为 w， wi 与 真实 值 vo。 的 差 是 均值 为 0、 方 差 为 o 的 独立 随机 变 


量 , 则 最 优 的 群 评价 值 为 了 = D ww Jeh w = ML >) L enaar 


Oi jal 
价值 最 接近 真实 值 ,误差 方差 最 小 ,为 M 。 
按照 评价 值 的 最 优 法 则 ,评价 值 的 协同 方法 主要 有 加 权 平 均 法 、 算 术 平 
均 法 和 中 间 值 法 。 
2) 加 权 平 均 法 
加 权 平 均 法 即 与 最 优 法 相 一 致 的 方法 , 即 


按照 此 方法 协同 的 群 评价 值 为 最 优 值 ,但 是 应 用 该 方法 的 前 提 是 o; 已 
H. o? 反映 了 决策 者 i 的 评价 水 平 , 它 是 由 决策 者 参与 以 往 评价 的 历史 纪 
录 得 来 的 。 事 实 上 ,可 以 掌握 每 个 决策 者 的 评价 水 平 的 情况 是 极为 少见 的 。 
因此 实际 应 用 中 , 权 值 的 选择 也 不 太 可 能 按照 上 述 公 式 进行 。 但 是 可 以 依 
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据 此 思想 ,为 评价 水 平 较 高 的 决策 者 赋予 较 大 的 权 值 ,为 评价 水 平 较 低 的 决 
策 者 赋予 较 小 的 权重 。 

3) 算术 平均 法 

算术 平均 法 即 令 


其 评价 误差 方差 为 57 = LD . 当 所 有 的 oi? 均 相等 时 ,其 误差 方差 


ye 达到 最 小 。n 越 大 ,误差 方差 越 小 .这 说 明 当 各 决策 者 的 评价 水 平 相同 


或 相近 时 ,多 人 评价 的 协同 比 单个 评价 更 准确 ,因此 算术 评价 法 可 以 应 用 于 
各 决策 者 的 水 平 相近 ,或 者 缺乏 各 决策 者 的 历史 评价 纪录 ,无 法 区 别 各 决策 
者 评价 水 平 的 情况 。 

4) 中 间 值 法 

将 各 决策 者 的 评价 值 从 大 到 小 排序 , 取 中 间 的 几 个 值 作 算术 平均 ,得 到 
群 评价 值 ,这 种 协同 方法 称 为 中 间 值 法 。 在 竞赛 评分 中 常用 的 “去 掉 一 个 
(或 几 个 ) 最 高 分 ,去 掉 一 个 (或 几 个 ) 最 低 分 ,得 平均 分 ?的 方法 即 为 中 间 值 
法 。 由 于 最 大 、 最 小 的 评价 值 很 可 能 是 由 误差 方差 大 的 决策 者 产生 ,中 间 值 
法 即将 他 们 的 权重 降低 ,而 加 大 其 余 决策 者 的 权重 。 因 此 ,在 各 决策 者 评价 
水 平 不 一 ,又 无 法 事先 知道 各 决策 者 的 评价 水 平时 ,采用 中 间 值 法 有 利于 减 
小 总 评价 值 的 误差 ,特别 是 对 于 消除 个 别 评价 者 有 意 高 估 或 低估 的 影响 很 
有 效 。 

2 基于 评价 序 的 协同 

在 某 些 综合 评价 方法 特别 是 主观 评价 中 ,不 给 出 各 方案 的 评价 值 而 直 
接 给 出 各 方案 的 优 劣 顺序 。 这 种 情况 下 多 位 决策 者 评价 结果 的 协同 就 要 用 
基于 评价 序 的 协同 方法 。 


1) 线性 分 配 法 

线性 分 配 法 实质 上 就 是 一 种 评价 序 的 协同 方法 ,不 同 的 是 它 用 于 集结 
各 属性 的 评价 序 以 得 到 综合 评价 的 排序 。 同 样 地 ,这 种 方法 可 用 于 集结 各 
决策 者 的 评价 序 以 得 到 群 评价 序 ,这 里 不 再 详 述 。 

2) 平均 值 法 

平均 值 法 在 各 决策 者 给 出 的 评价 序 中 ,对 方案 的 位 次 数 作 简单 平均 , 青 
按照 此 平均 值 排出 群 评价 的 顺序 。 当 两 方案 平均 值 相同 时 可 令 方 差 较 小 的 
方案 排 在 前 面 。 平 均值 法 操作 简单 ,但 它 是 一 种 较 粗略 的 方法 。 

3) Borda 数 

设 方案 集 A = {asasan} RRE e 给 出 的 评价 序 为 ui(i = 1， 

an) & Bla) 表示 评价 序 u 中 后 于 方案 a; 的 方案 个 数 ,又 令 Blaj) = 


aoe 为 决策 者 e; 的 权重 系数 ,0 之 ww <1, Dw, = 1.B(w) 
称 为 a; 方案 的 Borda 数 。 


31.3 德尔 菲 法 


EAR AVE (Delphi Method) 又 称 “ 专 家 意见 法 ”, 是 为 了 克服 专家 会 议 法 
的 缺点 而 产生 的 一 种 专家 预测 方法 ,是 一 种 具有 广泛 的 代表 性 、 较 为 可 靠 且 
简单 易 行 的 群体 决策 方法 。 

德尔 非法 依据 系统 的 程序 ,采用 匿名 发 表意 见 的 方式 , 即 专家 之 间 不 得 
互相 讨论 ,不 发 生 横 向 联系 ,只 能 与 调查 人 员 发 生 关系 ,通过 多 轮 次 调查 专 
家 对 问卷 所 提问 题 的 看 法 ,经 过 反复 征询 归纳、 修改 ,最 后 汇总 成 专家 基本 
一 致 的 看 法 ,作为 预测 的 结果 。 在 预测 过 程 中 专家 彼此 互 不 相识 、 互 不 往 
来 ,这 就 克服 了 在 专家 会 议 法 中 经 常 发 生 的 专家 不 能 充分 发 表意 见 , 权 威 人 
物 的 意见 左右 其 他 人 的 意见 等 弊病 ,各 位 专家 能 真正 充分 地 发 表 自 己 的 预 
测 意见 
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1 德尔 菲 法 的 实施 步骤 

德尔 非法 的 具体 实施 步骤 如 下 : 

CL) 组 成 专家 小 组 。 按 照 课题 所 需要 的 知识 范围 ,确定 专家 。 专 家 人 数 
的 多 少 ,可 根据 预测 课题 的 大 小 和 涉及 面 的 宽窄 而 定 ,一 般 不 超过 20 人 。 

(2) 向 所 有 专家 提出 所 要 预测 的 问题 及 有 关 要 求 , 并 附 上 有 关 这 个 问题 
的 所 有 背景 材料 ,同时 请 专家 提出 还 需要 什么 材料 ,然后 由 专家 做 书面 
答复 。 

(3) 各 个 专家 根据 他 们 所 收 到 的 材料 ,提出 自己 的 预测 意见 ,并 说 明 自 
己 是 怎样 利用 这 些 材 料 并 提出 预测 值 的 。 

(4) 将 各 位 专家 的 第 一 次 判断 意见 汇总 , 列 成 图 表 , 进 行 对 比 ,再 分 发 给 
各 位 专家 ,让 专家 比较 自己 同 他 人 的 不 同意 见 ,修改 自己 的 意见 和 判断 。 也 
可 以 把 各 位 专家 的 意见 加 以 整理 ,或 请 身份 更 高 的 其 他 专家 加 以 评论 ,然后 
把 这 些 意 见 再 分 送 给 各 位 专家 ,以 便 他 们 参考 后 修改 自己 的 意见 。 

(5) 将 所 有 专家 的 修改 意见 收集 起 来 ,汇总 ,再 次 分 发 给 各 位 专家 ,以 便 
做 第 二 次 修改 。 逐 轮 收集 意见 并 为 专家 反馈 信息 是 德尔 菲 法 的 主要 环节 。 
收集 意见 和 信息 反馈 一 般 要 经 过 三 、 四 轮 。 在 向 专家 进行 反馈 的 时 候 , 只 给 
出 各 种 意见 ,但 并 不 说 明 发 表 各 种 意见 的 专家 的 具体 姓名 。 这 一 过 程 重 复 
进行 ,直到 每 一 个 专家 不 再 改变 自己 的 意见 为 止 。 

(6) 对 专家 的 意见 进行 综合 处 理 。 

2 德尔 菲 法 与 专家 会 议 法 的 比较 

德尔 菲 法 同 常见 的 召集 专家 开会 .集体 讨论 .得 出 一 致 预测 意见 的 专家 
会 议 法 既 有 联系 又 有 区 别 。 德 尔 菲 法 能 发 挥 专家 会 议 法 的 优点 : 

(1) 能 充分 发 挥 各 位 专家 的 作用 ,集思广益 ,准确 性 高 。 

D 能 把 各 位 专家 意见 的 分 歧 点 表达 出 来 , 取 各 家 之 长 , 避 各 家 之 短 。 

同时 ,德尔 菲 法 又 能 避免 专家 会 议 法 的 缺点 : 

(1) 权威 人 士 的 意见 影响 他 人 的 意见 。 


(2) 有 些 专 家 碍 于 情 面 ,不 愿意 发 表 与 其 他 人 不 同 的 意见 。 

(3) 出 于 自尊 心 而 不 愿意 修改 自己 原来 不 全 面 的 意见 。 德 尔 菲 法 的 主 
要 缺点 是 过 程 比较 复杂 ,花费 时 间 较 长 。 

在 这 里 ,需要 注意 两 个 问题 : 

(1) 并 不 是 所 有 被 预测 的 事件 都 要 经 过 步骤 (1) 一 (4)。 可 能 有 的 事件 
在 步 又 (2) 就 达到 统一 ,而 不 必 在 步骤 (3) 中 出 现 。 

(2) 在 步骤 (4) 结 束 后 ,专家 对 各 事件 的 预测 也 不 一 定 都 达到 统一 。 不 
统一 也 可 以 用 中 位 数 和 上 下 四 分 点 来 作 结论 。 事 实 上 ,总 会 有 许多 事件 的 
预测 结果 都 是 不 统一 的 。 

德尔 非法 作为 一 种 主观 .定性 的 方法 ,不 仅 可 以 用 于 预测 领域 ,而 且 可 
以 广泛 应 用 于 各 种 评价 指标 体系 的 建立 和 具体 指标 的 确定 过 程 。 


31.4 投票 表决 


在 群体 决策 的 各 种 方法 里 ,投票 表决 是 在 现实 生活 中 应 用 最 广 、 使 用 最 
方便 、 效 果 最 明显 的 方法 。 

在 实际 过 程 中 ,投票 表决 一 般 由 两 步 组 成 : 投票 和 计 票 。 投 票 过 程 应 简 
单 易 行 , 计 票 过 程 应 准确 有 效 。 根 据 表 决 过 程 是 否 进行 排序 ,可 以 分 为 非 排 
序 式 投票 表决 (non-ranked voting systems) 和 排序 式 投票 表决 (ranked 
voting systems) 两 类 。 下 面 重 点 对 非 排序 式 投票 表决 的 主要 情况 进行 归纳 。 

1. 只 有 一 人 当选 的 情况 

只 有 一 人 当选 时 ,常用 的 投票 表决 方式 有 计 点 式 、 简 单 多 数 制 、 半 数 代 
表 制 二 次 投票 法 、 反 复 投票 表决 法 等 。 

1) 当 候选 人 只 有 两 个 时 

主要 采用 计 点 式 (spotvote) : 投票 采用 每 人 一 票 的 形式 , 计 票 采用 简单 
多 数 票 (simpleplurality) 法 则 ( 即 相对 多 数 )。 计 点 式 是 最 简单 的 投票 表决 
FH. 
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2) 当 候 选 人 多 于 两 个 时 

既 可 以 采用 简单 多 数 票 (相对 多 数 ) 法 则 ,也 可 以 采用 过 半数 (majority) 
法 则 ( 即 绝 对 多 数 ) 。 若 采用 过 半数 法 则 , 当 第 一 次 投票 无 人 获得 过 半数 选 
票 时 ,一 般 有 两 种 处 理 方式 : 

(1) 二 次 投票 : 对 前 两 名 进行 再 次 投票 , 同 候选 人 只 有 两 个 的 情形 。 该 
投票 表决 方式 在 法 国 总 统 选举 ,俄罗斯 总 统 选举 中 均 有 应 

(2) 反复 投票 : 先 淘汰 部 分 候选 人 ,然后 重复 投票 过 程 。 淘 汰 候选 人 的 
方式 一 般 有 两 种 : 一 是 候选 人 自动 退出 ,如 美国 两 党 派 的 总 统 候选 人 提名 竞 
选 ; 二 是 得 票 最 少 的 候选 人 被 强制 淘汰 ,如 奥运 会 申办 城市 的 确定 。 

需要 特别 说 明 的 是 ,无 论 简单 多 数 票 法 则 、 过 半数 规则 ,还 是 二 次 投票 ， 
都 有 不 尽 合理 之 处 。 

M De Condorcet 早 在 18 世纪 即 指出 , 当 存 在 2 个 以 上 的 候选 人 时 ,只 
有 一 种 办 法 能 严格 而 真实 地 反映 群 中 多 数 成 员 的 意愿 ,这 就 是 对 候选 
行 成 对 比较 。 若 存在 某 个 候选 人 ,他 能 按 过 半数 决策 规则 击败 其 他 所 有 候 
选 人 , 则 他 被 称 为 Condorcet 候选 人 ,应 由 此 人 当选 。 这 一 原则 称 为 
Condorcet 原则 。 

2 两 人 或 多 人 当先 的 情况 


1) 一 次 性 非 转移 式 投票 表决 (single nontransferable voting) 

投票 人 每 人 一 票 ,得 票 多 的 候选 人 当选 。 日 本 议员 选举 (选区 制 ,每 选 
区 当选 人 数 超过 2 个 ) 自 1890 年 起 一 直 采 用 此 方式 。 

2) 累加 式 投票 (cumulate voting) 

每 个 投票 人 可 投票 数 等 于 拟 选 出 人 数 ,选票 由 选举 人 自由 支配 ,可 投 同 
一 候选 人 若干 票 。 该 方式 的 好 处 在 于 可 切实 保证 少数 派 的 利益 ,大 多 用 于 
学 校 董事 会 的 选举 (注意 : 公司 董事 会 的 选举 与 此 不 同 ), 在 英国 历史 上 
(1870 一 1902 年 ) 也 有 应 用 


3) 名 单 制 (listsystem) 

由 各 党 派 团体 开 列 候选 人 名 单 ,投票 人 每 人 一 票 , 投 给 党 派 团体 ,而 不 
是 直接 投 给 候选 人 个 人 。 最 后 根据 各 党 派 团体 的 名 单 的 得 票数 来 分 配 席 
位 ,并 按 各 名 单 应 得 席位 与 名 单 上 候选 人 的 次 序 确定 具体 人 选 。 此 方式 于 
1899 年 始 用 于 比利时 ,以 后 被 荷兰 .丹麦 ,挪威 和 瑞典 等 国 采 用 。 

常用 的 分 配 席位 的 方法 ( 即 计 票 方式 ) 有 两 种 : 最 大 均值 法 和 最 大 余额 
法 。 可 以 证 明 ,最 大 均值 法 对 大 党 有 利 , 最 大 余额 法 对 小 党 有 利 。 

3 其 他 投票 表决 (选举 ) 方 法 

下 面 再 简单 列举 几 种 应 用 相对 少 一 些 的 方法 ,因为 比较 容易 理解 ,只 通 
过 简单 的 例子 进行 说 明 : 

1) 资格 认定 

(1) 候选 人 数 M 王 当选 人 数 氏 , 即 等 额 选 举 , 用 于 不 存在 竞争 或 不 允许 
竞争 的 场合 。 

(2) 不 限定 人选 人 数 ,如 学 位 点 评审 、 职 称 评定 .评奖 等 ,目的 不 是 排序 ， 
而 是 按 某 种 标准 来 衡量 被 选 对 象 。 

2) 非 过 半数 规则 

非 过 半数 规则 如 表 3. 2 所 示 。 


表 3.2 非 过 半数 规则 


投票 表决 (选举 ) 方 法 应 用 案例 
2/3 多 数 美国 议会 推翻 总 统 否决 需要 2/3 多 数 
2/3 E> G60% HH es irq alll a 2/3 多 数 ,第 二 次 
3/4 BB 美国 完 法 修正 案 需要 3/4 州 议会 的 批准 
过 半数 支持 且 反 对 票 少 于 1/3 | 1993 年 前 我 国 博士 生 导师 的 资格 认定 
一 票 否决 联合 国安 理会 常任 理事 国 的 否决 权 


除了 以 上 介绍 的 几 种 方法 外 ,两 人 或 多 人 当选 时 还 有 复式 投票 
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(multiple voting) ,3 bi M4 (limited voting) ,简单 可 转移 式 选举 (single 
transferable voting) JA A] #28 (approval voting) 等 方法 。 其 中 ,复式 投票 是 
指 每 个 投票 人 可 投票 数 等 于 拟 选 出 人 数 , 且 对 每 个 候选 人 只 能 投 一 票 ; 受 限 
的 投票 是 指 每 个 投票 人 可 投票 数 小 于 拟 选 出 人 数 , 且 对 每 个 候选 人 只 能 投 
一 票 。 在 实际 应 用 中 此 二 者 均 存 在 明显 的 弊端 , 即 在 激烈 的 党 派 竞争 中 , 实 

力 稍 强 的 党 派 将 拥有 全 部 席位 ,因此 该 方法 只 能 用 于 存在 共同 利益 的 团体 
和 组 织 内 部 。 

以 上 介绍 的 均 为 非 排 序 式 投票 表决 的 方法 。 排 序 式 投票 表决 的 方法 较 
非 排序 式 复杂 ,其 中 涉及 到 一 些 非常 著名 、 也 是 基础 性 的 理论 和 方法 ,如 
Borda 法 (1770 年 提出 )、Condorcet 原则 (1785 年 提出 ) ,投票 悖 论 ( 群 的 排序 
不 具 传 递 性 ,出 现 多 数 票 的 循环 ) 等 。 除 此 之 外 ,还 有 一 些 策略 性 投票 方法 ， 
如 谎报 偏好 .选票 交易 .小 集团 操纵 .次 序 效应 等 。 对 于 这 些 理论 和 方法 , 限 
于 篇 幅 不 在 本 书 介绍 , 感 兴趣 的 读者 可 自行 查阅 决策 支持 和 决策 分 析 领域 
的 相关 专业 书籍 。 

衡量 一 个 好 的 选举 方法 的 标准 应 当 至 少 具备 以 下 三 个 方面 的 特点 : 

(1) 能 和 否 充 分 利用 各 成 员 的 偏好 信息 。 

(2) 若 存在 Condorcet 候选 人 ,应 能 使 其 当选 。 

(3) 能 防止 策略 性 投票 。 

这 里 需要 特别 说 明 的 是 ,目前 尚 没有 任何 一 种 投票 表决 方法 对 策略 性 
投票 具有 防御 能 力 。 


应 用 案例 1 人 才 招聘 的 群体 决策 信息 协同 


人 才 招 聘 决 策 是 一 个 典型 的 不 确定 多 属性 的 决策 问题 ,需要 对 群体 的 
决策 进行 协同 。 下 面 ,以 播音 主持 人 招聘 为 例 (5 位 专家 、10 位 播音 主持 
人 ) ,构建 人 才 招 聘 的 群体 决策 综合 评价 (多 源 决 策 信息 协同 ) 模 型 。 


1. 评 价 指标 体系 建立 

采用 专家 咨询 法 ,筛选 出 能 够 全 面 描述 播音 员 和 主持 人 的 评价 指标 。 

构建 指标 体系 : 去 语言 表达 , 副 语言 表达 ,职业 精神 ,知识 技能 ,现场 表 
现 ,思想 觉悟 ,社会 调查 > 。 

(1) 语言 表达 cl : 去 语言 规范 度 ,嗓音 条 件 ,语言 表现 >。 

(2) 副 语言 表达 co 所 化 妆 服 饰 发 型 ,眼神 表情 体态 二。 

(3) 职业 精神 cs: 二 自律 能 力 , 社 会 责任 ,专业 精神 ,团队 意识 ,奉献 精神 二 。 

(4) 知识 技能 ca: 二 文化 知识 ,附加 技能 二 。 

(5) 现场 表现 cs : 一 参与 节目 的 积极 性 ,与 现场 人 员 的 配合 ,现场 效果 ， 
个 人 风格 与 节目 贴 合 度 , 传 播 准 确 到 位 二 。 

(6) 思想 觉悟 ce : 二 政治 水 平 ,法 律 意识 ,道德 观念 > 。 

(7) 社会 调查 cy : 去 收视 率 , 受 众 满意 度 ,主持 人 知名 度 ,节目 美誉 度 二 。 

2 专家 打分 


(1) 10 个 播音 主持 人 员 构 成 的 论 域 为 U= {2122230} 7 个 一 | ilai 
级 指标 构成 了 条 件 属性 集 C= {c1 C23 scares scorer} o EERE. P, 
差 } 分 别 对 应 {2,1,0)。 

(2) 5 个 专家 根据 7 个 指标 和 3 个 评价 等 级 ,分 别 对 10 个 播音 主持 人 员 


的 表现 进行 打分 。 设 定 5 个 专家 的 意见 是 同等 重要 的 ,因此 取 5 个 专家 的 
平均 分 并 取 整 ,系统 计算 出 10X7 关系 矩阵 ,如 表 3.3 所 示 。 
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R33 关系 矩阵 

c C2 Cs Cy Cs Cs C7 
x 2 1 2 1 1 $ 1 
X 2 2 1 1 2 I 2 
X; 1 1 2 1 1 2 1 
x 1 2 1 2 2 1 2 -= 
X5 0 0 1 1 0 0 人 
Xs 2 2 0 1 2 0 2 89 


多 BER 
源 
a a cz Cs 人 cs Ce Cr 
th X, 0 1 0 1 1 0 i 
同 
4 Xs 1 0 1 1 0 1 0 
市 Xs 1 2 0 1 2 0 2 
A Xio £ 1 1 1 2 1 2 
域 
级 
大 3. 指标 体系 约 简 
入 系统 依据 Skowron 提出 的 信息 系统 区 分 矩阵 的 定义 和 表 3. 3 构造 出 区 
用 — 
5 分 矩阵 ,如 表 3.4 所 示 。 
演 
进 
表 3.4 区 分 矩阵 
Xl X2 Xs x, Xs Xe X Xs Xo 
Xl 0 0 0 0 0 0 0 0 0 
C2 orCs» 
Xz 0 0 0 0 0 0 0 0 
Cs 9C7 
PlsC2 C3 ,| 
xs | ec [LES 0 0 0 0 0 0 0 
C5 906 oC7 
Cy sC2 C3 $ C2 9C3 C4 o 
| 0 0 0 0 0 0 
Cd4yc5yC7 C5 sC6 oC 
xa [UME] Carcas fer vee res oer sez reas] 0 a ï A i 
C5 907 C5 9C7 C5 9 C6 C7 C5 9C7 
Ice ,cs rcs» rsycaycsi Circas kisczscs, 
Se Rl eae el, Set A 0 0 0 
C sC? C5 C6 oC7 C4 CK C5 C6 9C7 
Cl oC2 C3 ， 
lycz vca 5 C2 scayc5 s| clycz， 
Xr | clycayc6 oe ee C1 93 yc6 |C4 scs 9 C6 。 Paes sa 0 0 0 
C5yC6 ycC7 Ce sc Cs oC 
cy 
(C1 yca yca ,ci C2 ycs ca C3 oCs olC2 Cy Cs (C1 C2 yca C1 C2 oC3 9 
Xs Cl 0 0 
c5ycy cy Cesc: cy Cs Ce ycy | cs yceyc7 
Claycz ycC3， {C2 ,cs ycC5， C1 C2 2C3 9 CisC2» C223 95% 
Xo C1 9 C3 yc6 C3 9C4 3g a 0 
Cs C6 C7 Ce yc7 C5 sCe oC7 Cs oC7 Ce yc7 
= clycs， C3 sC5 s clycz，| clycz，|caycsycs， 
X10 clycz C2 yct C2 9€5 sC7 |C2 ,cs 6 
C5，C7 Cg C7 C5 9C7 C3 C6 C6 C7 


90 根据 区 分 矩阵 构造 出 区 分 函数 并 用 吸收 率 进行 化 简 得 : 


f= Cer Nez Acs) V Cer Acs Neg Acs) V Cer Acs Neg Acr) 
V Cei Ace Ace) V Cer Aca Acs Ace) V Cer Aca Ncs Acr) 

MAK Sal ERE HY A PEOR PE c , 即 语言 表达 ,说 明基 本 功 对 主 
持 人 的 重要 性 。 这 些 约 简 是 并 列 关系 ,可 以 选取 任意 一 个 作为 约 简 结果 ,一 
般 选择 指标 个 数 最 少 的 约 简 集 。 在 此 ,专家 根据 系统 计算 出 的 约 简 集 ,并 结 
合 对 评价 对 象 的 要 求 进行 选择 ,这 里 选取 {c, coy co} (语言 表达 , 副 语言 表 
达 , 思 想 觉 悟 )。 用 这 种 方法 有 效 地 缩减 了 评价 指标 的 规模 。 

最 终 确定 的 指标 体系 为 : 

(1) 语 言 表达 o: 所 语言 规范 度 ,嗓音 条 件 , 语 言 表现 >。 

(2) 副 语言 表达 cs: 所 化妆 服饰 发 型 ,眼神 表情 体态 二 。 

(3) 思 想 觉悟 ce : 到 政治 水 平 ,法 律 意 识 , 道 德 观念 二 。 

4 指标 权重 确定 

根据 对 播音 主持 人 评价 构成 的 信息 系统 表 可 求 得 约 简 后 的 指标 权重 : 

C/D 的 等 价 类 : {{z1},{zz}, {zs}, {x} {zs}), {zoe}, ixr} {zs} {zs}, 
{x10}}。 

Cle} ASB: (Lar aio} {aera} {23}, {rs s28} s {26s} {zr)}。 

C(cz} 的 等 价 类 : { {zi ,x2}, {23}, {reer tr} tas} s {x6} o {zi sx)}。 

Ct{ce) 的 等 价 类 : (Lar). {2226}, {zx3sTisTi0}), {TsT9), {rs}), {xs}}。 

系统 根据 公式 计算 指标 的 权重 如 下 : 


nods |x: | 1 Hl) 1 x (1 3) 10 9 
arr lU] lU] 10 10 10 


KC laD=ġx( Tath 5x2 8z 


10 10 10 10 100 
_ 80 80 
FI IC (ea) =g C le D= Tog 
siga- |4 | KO— IKC- Jal 
We, n 


i 


Zi oy (ce) lO = DY MC— |e; |) 
j=l jai 
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9 82 
= 10 100 =e 
9 82 80 80 7 
T 100 w0) 
5 ， -5 
同 理 w, Tq 一 这。 
5 综合 评价 协同 


根据 指标 权重 和 约 简 后 的 指标 值 ,采用 线性 加 权 法 对 各 个 指标 进行 加 
权 计 算 , 求 得 10 个 播音 主持 人 的 综合 评价 得 分 : 
区 
(0. 2857,0. 3571,0.3571)x]1 2 12 02 1021 
1121100101 
= (1.29 1.64 1.36 1.36 0.36 1.29 0.36 0.64 1.00 1.00) 
10 名 播音 主持 人 的 排序 结果 为 : 
Xp L3 SID L1 =Le D Ly = L1 D Lg D Ls = T7 
采用 TOPSIS 方法 计算 的 步骤 在 此 不 详 述 ,10 名 播音 主持 人 的 排序 结 
果 为 : 
L3 >L LD L1 L D Le D Ly > Lg L5 > 
可 以 看 出 ,线性 加 权 法 和 TOPSIS 法 得 到 的 排序 结果 基本 一 致 ,但 在 个 
别 主持 人 的 排序 上 因 选 择 方法 的 不 同 产生 了 微调 。 


32 面向 城市 管理 的 多 源 信息 协同 


321 信息 协同 的 内 涵 与 前 沿 趋 势 


1. 信息 协同 的 内 涵 与 基本 概念 
德国 斯 图 加 特大 学 教授 .著名 物理 学 家 哈 肯 (Hermann Haken) F 1971 
年 提出 了 “协同 ”的 概念 ,并 于 1976 年 系统 地 论述 了 协同 理论 ,主要 研究 远离 


平衡 态 的 开放 系统 在 与 外 界 有 物质 或 能 量 交换 的 情况 下 ,如 何 通过 自己 内 
部 协同 作用 ,自发 地 出 现时 间 、 空 间 和 功能 上 的 有 序 结构 。 

信息 协同 是 指 以 信息 为 对 象 ,多 个 信息 源 在 规定 的 时 间 和 空间 内 ,按照 
统一 的 规则 实现 信息 的 有 序 流转 。 与 信息 协同 相关 的 基本 概念 主要 有 信息 
提供 方 、 信 息 需 求 方 、 信 息 协 同 节点 、 信 息 协 同 流程 等 。 

(1) 信息 提供 方 : 提供 信息 的 组 织 ( 或 个 人 ) ,信息 协同 流程 的 发 起 方 。 

(2) 信息 需求 方 : 获取 信息 的 组 织 (或 个 人 ) ,信息 协同 流程 的 接收 方 。 

(3) 信息 协同 节点 : 位 于 信息 组 织 ( 或 个 人 ) 内 部 ,实现 与 其 他 信息 组 织 
(或 个 人 ) 之 间 的 信息 协同 流程 。 在 管理 定位 上 相当 于 “传达 室 ” 的 功能 ,在 
技术 层面 一 般 表现 为 前 置 机 的 形式 。 

(4) 信息 协同 流程 : 每 一 类 信息 在 信息 提供 方 和 信息 需求 方 之 间 的 共 
享 对 应 一 个 信息 协同 流程 ,在 业务 和 技术 层面 分 别 对 应 信息 协同 业务 流程 
和 信息 协同 技术 流程 。 

与 传统 城市 运行 中 的 信息 获取 方式 不 同 ,智慧 城市 运行 中 的 信息 包含 
大 量 的 物 联 信息 ,来 自 于 对 城市 中 不 同 实体 状态 和 行为 的 实时 感知 ,呈现 出 
多 源 . 异 构 海量 .实时 、 不 间断 的 显著 特征 。 物 联 信 息 正 逐步 取代 传统 的 业 
务 信息 ,成 为 城市 运行 管理 中 信息 流转 的 主体 。 

物 联 信息 主要 包括 实时 感知 信息 和 物 联 综合 信息 两 类 。 

(1) 实时 感知 信息 : 指 通过 感知 设备 实时 采集 或 读 取 的 信息 ,如 自动 气 
象 站 温度 实时 信息 、 消 防 车 辆 GPS 实时 信息 等 。 

D 物 联 综合 信息 : 指 在 智慧 城市 领域 应 用 中 通过 汇总 、 分 析 等 方式 形 
成 的 综合 性 信息 ,如 某 地 区 的 天 气 预 报信 息 、 某 区 域 的 危险 化 学 品 流向 信 
息 等 。 

物 联 信息 通过 物 联 信息 元 数据 来 描述 具体 的 内 容 、 质 量 、 表 示 方 式 、 管 
理 方式 以 及 数据 集 的 其 他 特征 。 物 联 信息 元 数据 由 元 数据 实体 和 元 数据 元 
素 组 成 ,是 实现 物 联 信息 共享 的 核心 部 分 。 

物 联 信息 所 涉及 的 实体 统称 为 物 联 实 体 ,主要 包括 感知 设备 ,管理 对 象 
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和 传 感 网 网 关 三 类 。 

C) 感知 设备 (sensing device) : 指 能 够 实时 监测 ,感受 .识别 外 界 信息 ， 
并 将 获取 的 信息 传递 给 其 他 装置 的 物理 设备 ,如 温度 传感器 .数字 摄像 头 、 
卫星 定位 设备 .射频 识别 读 写 器 等 。 

(2) 管理 对 象 (managed object) : 指 需要 通过 感知 设备 来 进行 辅助 监管 
和 监控 的 业务 实体 对 象 ,主要 包括 地 理 实体 、 物 品 和 证 照 三 类 。 地 理 实体 包 
括 自然 地 理 实体 (如 山川 ,河流 ,湖泊 ,土地 等 ;和 人 工 建造 的 地 理 实体 (如 建 
筑 、 街 道 \ 公 路 ,桥梁 、 雕 塑 、 渠 坝 、 场 站 等 ); 物 品 包括 除了 地 理 实体 之 外 可 以 
移动 的 实体 ,如 车 辆 \ 井 盖 \、 感 知 设备 计算 机 等 ;证 照 包 括 由 政府 部 分 发 放 
的 具有 法 定 效 力 的 证 件 ,如 身份 证 .营业 执照 等 。 

(3) 传 感 网 网 关 (wireless sensor networks gateway): 指 能 够 将 物 联 感 
知 设备 采集 的 实时 感知 信息 进行 接 入 和 人 处理, 并 按照 规范 规定 的 格式 和 内 
容 打 包 后 依托 网 络 设施 进行 传输 的 一 种 设备 。 传 感 网 网 关 通 过 用 户 前 置 设 
备 (customer premise equipment,CPE) 与 物 联 数据 专 网 进行 连接 。 

2 信息 协同 的 前 沿 趋势 

1) 国外 研究 热点 和 趋势 

根据 Web of Science-SCI 和 Engineering Village(EI) 的 收录 情况 显示 ， 
截至 2014 年 年 底 国外 与 信息 协同 (information cooperation) 相 关 的 研究 成 
果 共 1131 篇 ,其 中 SCI 312 篇 .EI 819 篇 ,呈现 出 明显 的 逐年 递增 趋势 。 研 
究 人 员 和 成 果 的 分 布 区 域 以 中 国 和 美国 较为 突出 ,此 外 日 本 、 德 国法 国 、 加 
拿 大 英国 .意大利 、 韩 国 、 澳 大 利 亚 也 有 和 较 高 占 比 。 

SCI 的 研究 领域 中 自然 科学 约 占 63% ,社会 科学 约 占 17% ,自然 科学 与 
社会 科学 的 交叉 领域 约 占 20% ,研究 方向 以 计算 机 科学 \ 信 息 科学 、 工 程 学 
为 主 ( 见 表 3. 5)。 

EI 的 研究 成 果 所 涉及 学 科 分 布 相对 比较 平均 ,在 计算 机 软件 和 信息 处 
理 、 计 算 机 应 用 、 通 信 、 信 息 传播 ,数据 处 理 和 图 像 处 理 、 信 息 理论 和 信和 号 处 理 、 


R35 信息 协同 的 SCI 研究 方向 = 

SCI 研究 方向 数量 占 比 Ls 

Computer Science 计算 机 科学 96 30.77% E 

Information Science Library Science 信息 科学 .图 书馆 学 65 20. 83% z 

Pen a 9 源 

Engineering 工程 学 51 16.35% 信 

Business Economics 商学 .经 济 学 35 11. 22% i 

同 

Psychology 心理 学 29 9.29% Pa 

Health Care Sciences Services 健康 护理 学 .服务 科学 28 8.97% 准 

模 

Telecommunications 电信 学 21 6.73% a 

International Relations 国际 关系 学 21 6.73% z 
Communication 传播 学 16 5.13% 

( i S Si M: Sci 运 学 ` J E 

oo Research Management Science 运筹 管理 14 4.49% 


信息 检索 和 利用 .数学 、 人 工 智能 等 领域 均 有 代表 性 文献 ;研究 热点 集中 在 

信息 系统 .信息 传播 .多 主体 系统 .算法 、 计 算 机 模拟 .信息 理论 .信息 检索 、 

信息 管理 .最 优化 .信息 分 析 等 领域 ( 见 表 3. 6)。 bl 
表 3.6 信息 协同 的 EI 研究 热点 与 学 科 分 布 


(Ca) EI 研究 热点 


EI 研究 热点 数量 占 比 
Information Systems 信息 系统 81 9.89% 
Information Dissemination 信息 传播 74 9.04% 
Multi Agent Systems 多 主体 系统 56 6.84% 
Algorithms 算法 52 6.35% 
Computer Simulation 计算 机 模拟 51 6.23% 
Information Theory 信息 理论 49 5.98% 
Information Retrieval 信息 检索 48 5.86% 
Information Management 信息 管理 47 5.74% 
Optimization 最 优化 44 5.37% 
Information Analysis 信息 分 析 43 5.25% 
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(b) EI 学 科 类 别 


多 
源 
信 
息 
7 EI 学 科 类 别 数量 占 比 
l Computer Software, Data Handling and Applications it 
244 29.799 
a 机 软件 ,数据 处 理 与 应 用 á 
A Computer Applications 计算 机 应 用 207 25.27% 
域 
级 Telecommunication; Radar, Radio and Television 通信 ; 雷 207 25.27% 
$ 达 、\ 收 音 机 和 电视 ra 
= Information Dissemination 信息 传播 182 22, 22% 
应 =e ae 
用 Data Processing and Image Processing 数据 处 理 和 图 像 128 15.63% 
z 处 理 
进 Information Theory and Signal Processing 信息 理论 和 信号 
120 14.65% 
处 理 
Information Retrieval and Use 信息 检索 和 利用 111 13.55% 
Mathematics 数学 110 13.43% 
Artificial Intelligence 人 工 智 能 104 12.70% 
Radio Systems and Equipment 无 线 电 系统 和 装备 100 12. 21% 


D 国内 研究 热点 和 趋势 


根据 SCI 来 源 期 刊 .EI 来 源 期 刊 . 核 心 期 刊 (北京 大 学 2011 版 )、CSSCI 
期 刊 的 收录 情况 显示 ,截至 2014 年 年 底 国内 关于 “信息 协同 ”的 理论 和 应 用 
研究 共计 441 篇 相关 文献 。2012 年 ( 含 ) 之 后 的 研究 成 果 数 量 及 国家 自然 科 
学 基金 .国家 高 技术 研究 发 展 计划 (863 计划 ) 、 国 家 科技 支撑 计划 、 国 家 社会 
科学 基金 等 的 支持 项 目 数量 均 有 明显 的 提升 。 
研究 层次 主要 分 布 在 工程 技术 (自然 科学 ) ,行业 指导 (社会 科学 ) .基础 
研究 (社会 科学 ) 、 基 础 与 应 用 基础 研究 (自然 科学 )、 行 业 技术 指导 (自然 科 
= 学 ) ,政策 研究 (社会 科学 ) 等 方面 。 研 究 热点 主要 集中 在 信息 协同 模式 与 模 
= 型 .行业 应 用 、 协 同 管理 ,服务 与 创新 .信息 共享 与 融合 、 信 息 服务 与 信息 化 、 
信息 系统 与 Web 服务 、 知 识 管理 .协同 机 制 与 模式 、 物 联网 .协同 过 滤 、 云 计 
算 等 领域 ( 见 表 3.7) 。 


96 


表 3.7 信息 协同 的 国内 研究 热点 


国内 研究 热点 数量 占 比 国内 研究 热点 数量 占 比 
信息 协同 模式 与 模型 | 57 18.75% | 信息 系统 与 Web 服务 | 18 5.92% 
行业 应 用 55 18.09% “| 知识 管理 15 4.93% 
协同 管理 .服务 与 创新 | 52 17.11% “| 协同 机 制 与 模式 14 4.61% 
信息 共享 与 融合 20 6.58% || PRR ji 3.62% 
信息 服务 与 信息 化 18 5.92% 协同 过 滤 10 3.29% 


322 面向 城市 管理 的 信息 协同 应 用 模式 


1. 多 源 信息 协同 的 业务 模式 

面向 城市 管理 的 多 源 信息 协同 业务 模式 主要 包括 单 部 门 为 主 多 部 门 配 
合 、 多 部 门 流程 化 信息 协同 、 多 部 门 交 又 信息 协同 、 多 源 信息 整合 基础 信息 
协同 等 五 种 情况 。 

(1) 单 部 门 为 主 多 部 门 配合 模式 : 某 项 事件 涉及 多 个 部 门 , 但 以 一 个 部 
门 为 主 , 其 他 相关 部 门 配合 开展 事件 处 理 。 一 个 部 门 负责 信息 协同 流程 的 
发 起 ,将 信息 分 别 发 送 给 多 个 相关 部 门 进行 协同 处 理 , 结 合 各 部 门 反馈 的 结 
果 信 息 进行 事件 处 理 。 

(2) 多 部 门 流程 化 信息 协同 模式 : 某 项 事件 涉及 多 个 部 门 , 相 互 之 间 通 
过 前 后 置 协作 实现 联合 处 理 。 一 个 部 门 负责 信息 协同 流程 的 发 起 ,前 置 环 
节 结 果 信息 作为 后 置 环 节 事 件 处 理 的 必要 信息 。 

(3) 多 部 门 交叉 信息 协同 模式 : 两 个 及 以 上 部 门 对 同一 事件 同时 进行 
处 理 , 或 侧重 同一 事件 的 不 同方 面 ,通过 信息 协同 实现 各 个 环节 的 及 时 、 有 
效 开展 。 多 部 门 同时 处 理 同一 事件 时 ,部 门 间 通过 内 部 协同 机 制 实现 信息 
联动 。 多 部 门 处 理 同 一 事件 但 侧重 领域 或 面向 对 象 不 同时 ,各 部 门 分 别 进 
行事 件 处 理 , 通 过 信息 协同 获取 其 他 部 门 信息 作为 事件 处 理 的 参考 和 依据 。 

(4) 多 源 信息 整合 模式 : 由 一 个 部 门 统一 接 入 多 个 部 门 的 信息 ,整合 融 
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合 后 提供 信息 服务 。 一 个 部 门 接 入 获取 多 个 部 门 的 信息 ,进行 加 工整 合 、 分 
析 汇 总 、 多 维 融合 ,形成 综合 性 .主题 性 信息 ,以 统一 出 口 发 布 。 

(5) 共性 基础 信息 协同 模式 : 根据 实际 需求 ,各 部 门 或 信息 组 织 将 有 共 
性 需求 的 基础 信息 (如 人口 基础 信息 、 法 人 基础 信息 、 空 间 地 理 基 础 信息 、 宏 
观 经 济 基础 信息 、 城 市 部 件 基础 信息 、 城 市 基础 运行 状态 基础 信息 等 ) 统 一 
汇聚 、 整 合 和 服务 。 

2 多 源 信息 协同 的 技术 模式 

面向 城市 管理 的 多 源 信息 协同 技术 模式 主要 包括 信息 交换 信息 目录 、 
接口 调用 等 多 种 情况 。 

(1) 信息 交换 模式 : 根据 跨 部 门 . 跨 区 域 信息 共享 需求 ,部 门 之 间 协 商 
确定 信息 共享 内 容 、 交 换 频率 、 提 供 部 门 、 需 求 部 门 等 ,建立 信息 交换 对 子 。 
需求 部 门 按照 交换 规则 获取 提供 部 门 的 各 类 信息 。 

(2) 信息 目录 模式 : 提供 部 门 对 可 协同 信息 进行 编目 ,形成 目录 信息 ， 
在 统一 的 基础 支撑 平台 上 进行 注册 ;需求 部 门 通过 查询 信息 目录 ,访问 可 协 
同 信息 的 目录 信息 ,并 依据 权限 访问 具体 信息 内 容 。 

G) 接口 调用 模式 : 提供 部 门 对 可 协同 信息 进行 封装 形成 服务 ,在 统一 
的 基础 支撑 平台 上 进行 注册 ,形成 服务 清单 ;需求 部 门 查询 服务 清单 ,访问 
数据 库 、 页 面 .Portlet、Web 服务 、 应 用 系统 等 服务 资源 的 描述 信息 ,并 依据 
权限 访问 、 调 用 服务 资源 接口 。 

除 此 之 外 ,还 有 页 面 集成 整合 .基于 业务 协同 的 信息 审核 确认 等 其 他 技 
术 模 式 。 

3 多 源 信息 协同 的 推进 模式 

面向 城市 管理 的 多 源 信息 协同 推进 模式 主要 包括 : 重大 应 用 推进 模式 、 
重大 热点 问题 协同 推进 模式 ,部门 整体 共享 推进 模式 ( 某 个 部 门 把 需要 内 外 
共享 的 信息 整体 协调 推进 ) ,决策 服务 推进 模式 、 业 务 协同 推进 模式 (业务 领 
域 /业务 主题 相关 部 门 之 间 的 协同 )、 常 规 结对 子 共 享 推进 模式 等 。 


4 多 源 信 息 协 同 模式 的 其 他 维度 分 析 

除了 业务 模式 、 技 术 模式 、 推 进 模式 等 维度 的 研究 之 外 ,面向 城市 管理 
的 多 源 信 息 协同 还 有 以 下 一 些 研 究 维度 : 

(1) 从 层次 维度 : 同 级 组 织 间 信息 协同 、 跨 层级 信息 协同 。 

(2) 从 范围 维度 : 信息 组 织 内 部 、 信 息 组 织 之 间 。 

(3) 从 信息 分 布 维度 : 集中 共享 服务 、 分 布 式 交 换 等 

(4) 从 信息 性 质 维度 : 基础 信息 .领域 主题 信息 等 。 

5 多 源 信息 协同 水 平 的 测度 

目前 ,面向 城市 管理 的 多 源 信 息 协同 水 平 测度 主要 包括 五 个 方面 : 一 是 
目录 更 新 情况 ,是否 按 计划 进行 需求 目录 和 共享 目录 的 更 新 或 审核 确认 ;二 
是 被 需求 目录 的 响应 情况 ,是否 及 时 响应 被 需求 目录 的 情况 ;三 是 信息 提供 
情况 ,是否 按 计划 进行 数据 提交 和 更 新 ,提交 数据 的 内 容 与 目录 是 否 一 致 ; 
四 是 数据 质量 情况 ,向 其 他 部 门 提供 的 数据 质量 是 否 满足 需求 ;五 是 应 用 案 
例 ,信息 协同 是 否 支 撑 了 重大 应 用 或 有 典型 的 应 用 案例 。 
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323 多 源 信 息 融 合 的 内 涵 与 发 展 


1. 多 源 信息 融合 的 内 涵 

1) 从 信息 环境 看 多 源 信息 融合 

当前 的 数据 环境 已 呈现 出 从 海量 数据 环境 向 大 数据 环境 转化 的 趋势 。 
大 数据 的 特点 之 一 是 数据 类 型 繁多 ,基于 各 种 数据 类 型 的 分 析 是 大 数据 的 
典型 特点 之 一 。 电 子 邮 件 \ 访 问 日 志 、 交 易 记 录 、 社 交 网 络 、 即 时 消息 、 视 频 、 
照片 .语音 等 ,是 大 数据 的 常见 形态 ,这 些 数 据 从 不 同 视角 反映 人 物 、 事 件 或 
活动 的 相关 信息 ,把 这 些 数据 融合 汇聚 在 一 起 进行 相关 分 析 , 可 以 更 全 面 地 | 
揭示 事物 联系 ,挖掘 新 的 模式 与 关系 ,从 而 为 科学 有 效 的 管理 决策 .商业 模 让 
式 的 制定 、 竞 争 机 会 的 选择 提供 有 力 的 数据 支撑 与 决策 参考 。 二 

同一 个 事实 或 规律 可 以 同时 隐藏 在 不 同 的 数据 形式 中 ,也 可 能 是 每 一 99 
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种 数据 形式 分 别 支持 了 同一 个 事实 或 规律 的 某 一 个 或 几 个 侧面 ,这 既 为 数 
据 和 信息 分 析 的 结论 的 交叉 验证 提供 了 契机 ,又 要 求 分 析 者 在 分 析 研 究 过 
程 中 有 意识 地 融 集 各 种 类 型 的 数据 ,从 多 种 信息 源 中 发 现 潜 在 知识 与 情报 。 
因此 ,综合 利用 多 来 源 、 多 形式 的 数据 是 现代 科学 决策 的 鲜明 特点 。“ 兼 听 
则 明 , 偏 信 则 暗 ”, 多 维度 、 多 数据 源 的 分 析 才 有 说 服 力 。 

2) 从 业务 需求 看 多 源 信息 融合 

通过 关联 主题 分 析 可 以 识别 出 一 些 模 式 , 从 而 实现 需求 驱动 的 跨 业 务 
的 关联 分 析 。 例 如 ,根据 常住 人 口 数据 、 流 动人 员 数 据 、 房 屋 数 据 ,运用 关联 
规则 挖掘 方法 分 析 城 乡 结合 部 流动 人 口 密 集 与 多 发 事件 的 关系 ,通过 对 海 
量 数 据 的 统计 分 析 、 时 间 序 列 、 趋 势 外 推 监 测 分 析 、 价 值 挖 掘 、 场 景 预测 等 
进行 模式 发 现 、 规 律 验 证 ,趋势 预测 、 根 源 分 析 、 与 情 监控 等 ,从 而 实现 事前 
预防 、 综 合 应 急 、 科 学 决策 以 及 支撑 快速 处 理 等 。 实 现 多 渠道 信息 汇聚 “一 
口 进 ”, 决 策 指令 才能 “一 口 出 ”, 减 少 信 息 错 漏 ,防止 决策 失误 。 

以 现 有 的 数字 化 城市 运行 体征 情况 为 基础 ,建立 科学 的 预警 机 制 , 实 现 
对 城市 管理 问题 科学 \ 准 确 地 事前 预防 与 快速 处 理 ,依据 城市 运行 以 及 问题 
发 生 的 规律 趋势 根源 的 分 析 , 依 据 城市 运行 动态 数据 为 领导 提供 强大 的 
数据 支撑 和 多 视角 的 决策 分 析 。 

D 多 源 信息 融合 的 基本 概念 

把 不 同 渠道 ,利用 多 种 采集 方式 获取 的 具有 不 同 数 据 结构 的 信息 汇聚 
到 一 起 ,形成 具有 统一 格式 、 面 向 多 种 应 用 的 数据 集合 ,这 一 过 程 称 为 多 源 
信息 融合 。 多 源 信 息 融 合 技术 是 研究 如 何 加 工 、 协 同 利用 多 源 信息 ,并 使 不 
同形 式 的 信息 相互 补充 ,以 获得 对 同一 事物 或 目标 的 更 客观 、 更 本 质 认识 的 
信息 综合 处 理 技 术 。 它 比 直 接 从 各 信息 源 得 到 的 信息 更 简洁 、 更 少 宛 余 、 更 
有 用 途 。 传 统 的 数据 融合 是 指 对 多 传感器 的 数据 在 一 定 准则 下 加 以 自动 分 
析 综合 的 信息 处 理 过 程 。 

4) 多 源 信息 融合 的 类 型 

多 源 信息 融合 包括 同型 异 源 信息 的 融合 、 异 质 异 构 信 息 的 融合 多 语种 


信息 的 融合 。 同 型 异 源 信息 融合 是 指 同 一 种 类 型 的 信息 可 能 分 布 在 不 同 的 
物理 存储 不 同 的 应 用 系统 ,隶属 于 多 个 机 构 部 门 , 这 些 不 同 来 源 的 信息 有 
着 不 同 的 来 源 渠道 采集 方式 、 加 工 体系 与 标准 ,也 有 着 不 同 的 服务 模式 ,使 
用 单一 数据 源 进行 分 析 很 难保 证 全 面 性 ,实际 分 析 时 往往 需要 将 多 种 数据 
集成 到 一 起 进行 融合 分 析 。 异 质 异 构 信息 融合 是 指 把 不 同类 型 不 同 结构 的 
信息 汇聚 到 一 起 ,以 更 全 面 地 反映 现状 ,说 明 问题 。 例 如 在 学 科 领 域 分 析 时 
需要 把 期 刊 论文 .学 位 论文 图书、 专利 、 项 目 、 会 议 等 信息 融合 汇总 ,重大 事 
件 监测 与 分 析 时 需要 把 数值 .文本 音频、 视频 等 不 同 媒体 格式 的 信息 汇聚 
到 一 起 进行 关联 综合 分 析 。 多 语种 信息 融合 是 指 把 不 同 语种 的 信息 融合 汇 
聚 到 一 起 进行 综合 集成 分 析 ,以 提高 信息 的 全 面 性 。 

2 多 源 信息 融合 的 发 展现 状 

1) 信息 融合 的 基础 理论 与 架构 

信息 融合 理论 最 早 应 用 于 军事 领域 ,定义 为 一 个 处 理 探测 、 互 联 ,估计 
以 及 组 合 多 源 信息 和 数据 的 多 层次 、 多 方面 的 过 程 ,以 便 获得 准确 的 状态 和 
身份 估计 完整 而 及 时 的 战场 态势 和 威胁 估计 。 而 随 着 网 络 海量 信息 化 的 
进程 ,信息 融合 逐渐 得 到 更 多 领域 的 关注 。 朱 子 华 等 根据 对 图 书 复杂 适应 
系统 的 研究 ,分 析 了 图 书信 息 融 合 系统 的 功能 需求 ,体系 结构 层次 和 技术 结 
构 层次 ,认为 信息 的 融合 主要 体现 在 不 同 角 色 之 间 的 信息 交互 。 胡 蓓 等 提 
出 产业 集群 知识 融合 的 新 观点 :应 用 理论 研究 与 实证 研究 相 结合 的 方法 , 采 
用 信息 融合 的 DSmT 技术 ,对 集群 内 、 外 部 知识 源 的 知识 进行 融合 。 刘 明 香 
将 基于 D-S 证 据 推理 的 信息 融合 技术 应 用 于 知识 转化 为 信息 的 过 程 中 ,使 
人 们 更 准确 快捷 地 获取 信息 。 

2) 信息 融合 的 层次 体系 

信息 融合 是 在 几 个 层次 上 完成 对 多 源 信息 的 处 理 过 程 ,其 中 每 一 层次 
都 表示 不 同 级 别 的 信息 抽象 ;信息 融合 的 结果 包括 较 低 层次 上 的 状态 和 身 
份 估计 ,以 及 较 高 层次 上 的 整个 战术 态势 估计 。 曹 建 君 等 把 信息 融合 划分 
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为 原始 数据 融合 或 象 元 级 融合 .目标 级 或 特征 级 融合 以 及 决策 级 融合 3 个 层 
次 。 任 红 娟 从 数据 库 扩 展 的 原始 级 信息 融合 .文本 挖掘 和 文献 计量 方法 结 
合 、. 词 汇 引 用 图 和 词 参考 文献 共 4 个 层面 对 当前 的 知识 结构 整合 方法 进行 了 
综述 。 宋 新 平等 针对 竞争 情报 系统 循环 的 不 足以 及 情报 源 的 特点 ,构建 一 
个 基于 信息 融合 综合 集成 研讨 厅 混 合 的 新 型 竞争 情报 系统 。 

3) 信息 融合 的 技术 与 流程 

刘 平 峰 等 针对 现 有 Web 信息 融合 对 多 维度 .多 粒度 综合 查询 分 析 和 决 
策 支持 不 足 的 问题 ,设计 面向 主题 的 Web 信息 融合 模型 ,该 模型 由 Web 仓 
库 模型 ` Web 信息 融合 功能 模型 和 人 机 交互 接口 三 层 组 成 。 陈 金海 针对 目 
前 科研 成 果 中 信息 融合 的 特点 ,研究 了 情报 信息 融合 处 理 方法 的 多 样 性 ,其 
中 主要 包括 情报 信息 分 类 处 理 过 程 . 科 技 信息 融合 处 理 和 情报 数据 的 融合 
技术 处 理 过 程 等 。 

4) 多 源 信息 融合 的 关联 分 析 

多 源 信息 融合 的 理论 基础 是 相关 性 原理 。 相 关 性 分 析 包 括 主题 相关 、 
任务 相关 、 情 境 相 关 、 用 户 相 关 等 。 相 关 关 系 的 核心 是 量化 两 个 数据 值 之 间 
的 数理 关系 。 相 关 关 系 强 是 指 当 一 个 数据 值 增加 时 , 另 一 个 数据 值 很 有 可 
能 也 会 随 之 增加 。 例 如 谷歌 流感 趋势 : 在 一 个 特定 的 地 理 位 置 ,通过 谷歌 搜 
索 流 感 相 关 的 特定 词 条 的 人 越 多 ,表明 该 地 区 患 流感 的 人 越 多 。 不 同 来 源 
的 数据 可 以 从 不 同 视角 反映 人 物 ,事件 或 活动 的 相关 信息 ,把 这 些 数 据 融合 
汇聚 在 一 起 进行 相关 分 析 , 可 以 更 全 面 地 揭示 事物 联系 ,挖掘 新 的 模式 与 关 
系 , 从 而 为 科学 有 效 的 管理 决策 .商业 模式 的 制定 .竞争 机 会 的 选择 提供 有 
力 的 数据 支撑 与 决策 参考 。 

3 多 源 信息 融合 的 业务 需求 

以 现 有 的 数字 化 城市 管理 情况 为 基础 ,建立 科学 的 预警 机 制 , 实 现 城市 
管理 问题 科学 、 准 确 地 事前 预防 与 快速 处 理 , 实 现 城市 运行 以 及 问题 发 生 的 
规律 .趋势 .根源 的 分 析 , 通 过 城市 运行 动态 数据 为 城市 管理 者 提供 强大 的 


数据 支撑 和 多 视角 的 决策 分 析 。 通 过 对 海量 数据 的 统计 分 析 ,趋势 外 推 , 监 
测 分 析 、 价 值 挖掘 ,场景 预测 等 进行 模式 发 现 ,规律 验证 、 趋 势 预测 .根源 分 
析 、 与 情 监控 等 ,实现 事前 预防 .综合 应 急 、 科 学 决策 以 及 支撑 快速 处 理 等 。 
从 决策 与 管理 需求 角度 来 看 ,多 源 信息 融合 的 业务 需求 主要 包括 综合 应 
与 情 监 控 、 预 警 监测 .问题 定位 、 形 势 分 析 、 模 式 分 析 等 。 

1) 综合 应 急 

应 急 数 据 综 合 汇聚 , 当 有 重大 突 发 事件 时 ,把 事件 所 涉及 的 人 员 、 房 屋 、 

城市 部 件 .应急 物 资 等 按 地 理 半 径 或 影响 程度 进行 汇聚 呈现 ,以 实现 重 特大 
突 发 事件 应 对 过 程 中 的 信息 快速 交换 、 精 确 传播 . 主 辅 责 部 门 之 间 的 横向 联 
动 和 协同 作战 ,使 应 对 和 处 置 的 效率 大 幅 提升 ,快速 反应 .协同 应 对 、 合 成 应 
急 能 力 显 著 提 升 。 

2) 与 情 监控 

通过 热线 电话 、 网 络 在 线 、 网 格 员 上 报 、 突 发 事件 等 实时 汇聚 热点 问题 ， 
把 握 和 与 情 动态 与 走向 ,包括 民众 关心 的 热点 问题 ,观点 倾向 .与 情 演 化 动 

3) 预警 监测 

在 业务 数据 基础 上 实现 趋势 预测 分 析 , 实 现 专项 数据 的 同比 \ 环 比 得 到 
若干 年 度 的 趋势 图 ,并 以 可 信 的 变化 率 ( 例 如 专业 机 构 、 主 管 机 构 公开 发 布 
的 数据 ) 为 基准 对 未 来 若干 年 度 做 出 预测 。 通 过 “六 位 一 体 ” 信 息 汇聚 网 络 
及 网 格力 量 反馈 ,构建 多 渠道 ,全 覆盖 的 预警 监测 体系 ,实时 掌握 风险 隐患 
和 动态 变化 ,破解 预警 传播 “最 后 一 公里 ”的 难题 。 

4) 问题 定位 

通过 城市 管理 各 类 监管 案件 ,公众 及 企业 诉求 热点 等 相关 指标 比较 , 通 
过 量化 分 析 来 定位 问题 ,以 便 及 时 查找 问题 \ 分 析 问 题 原 因 并 制定 相关 
措施 。 

5) 形势 分 析 

加 强 数据 分 析 和 案例 剖析 ,形成 城市 管理 监督 指挥 网 格 化 社会 服务 管 
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理 、 突 发 事件 的 “日 统计 、 周 汇总 、 月 分 析 和 季度 分 析 ” 机 制 ,为 部 署 下 阶段 工 
作 重 点 、 提 出 具体 应 对 之 策 提供 翔实 依据 。 

6) 模式 分 析 

通过 关联 式 主题 分 析 识 别 出 一 些 模 式 , 实 现 需 求 驱动 的 跨 业 务 的 关联 
分 析 。 如 通过 对 实 有 人 口 与 市 容 环 境 \ 日 常 隐患 与 突 发 事件 ,地 理 空间 实 有 
人 口 与 突 发 事件 等 几 个 方面 的 资源 关联 分 析 , 实 现 对 城市 运行 管理 问题 科 
学 ,准确 ,实时 地 事前 预防 与 快速 处 理 。 

4 多 源 信息 融合 的 发 展 方向 

1) 业务 信息 与 空间 信息 的 融合 

多 源 数据 融合 中 主要 涉及 业务 数据 与 空间 数据 ,在 建设 智慧 城市 的 进 
程 中 ,空间 数据 的 建设 ,分 析 与 应 用 得 到 了 前 所 未 有 的 关注 。 应 用 多 维度 、 
多 时 空 的 全 时 空 一 体 化 技术 ,建设 时 空 多 维 城市 管理 系统 ,将 二 维 地 图 ,三 
维 模型 三维 实景 .视频 等 各 类 基础 信息 与 城市 部 件 . 实 有 人 口 、 法 人 、 房 屋 
等 行业 管理 信息 整合 到 一 个 时 空 体系 中 ,在 全 时 空 体系 中 还 原 各 类 信息 在 
空间 、 时 间 、 权 属 等 多 个 维度 的 关联 关系 ,创新 三 维 立 体 直 观 的 、 实 时 的 可 视 
化 管理 模式 ,提高 社会 管理 、 城 市 管理 、 社 会 服务 、 应 急 管理 工作 的 效率 。 

2) 多 源 信息 的 统一 描述 与 深度 揭示 

不 同 来 源 不 同 结构 的 数据 融合 到 一 起 ,如 何 对 数据 资源 进行 统一 描述 、 
深度 揭示 是 数据 融合 的 关键 问题 之 一 。 虽然 实 现 了 多 种 来 源 、 多 种 采集 方 
式 的 数据 融合 ,但 是 对 各 类 文本 信息 、 热 线 电 话 录音 、 各 种 监控 视频 等 缺乏 
统一 描述 ,深度 揭示 。 统 一 描述 有 助 于 组 织 、 交 换 与 融合 ,深度 揭示 有 助 于 
进行 分 析 与 挖掘 ,提高 数据 的 利用 价值 ,因此 需要 从 内 容 上 对 多 种 信息 来 源 
不 同 数据 格式 的 信息 进行 融合 。 

3) 多 源 信 息 的 动态 关联 与 交叉 印证 

城管 平台 运行 相关 数据 、 非 紧急 救助 热线 相关 数据 、 社 区 人 台 账 相关 数 
据 、 网 格 上 报 相关 数据 、 数 据 容器 抓 取 相关 数据 、 应 急 指挥 平台 相关 数据 、 部 


门 提供 相关 数据 等 多 源 数据 在 实现 初步 融合 的 基础 上 ,进一步 形成 系统 、 完 
整 的 信息 链条 ,各 口径 数据 均 分 类 存储 在 不 同 的 专题 数据 库 中 ,而 单一 的 基 
础 数据 库 在 解决 综合 性 问题 的 时 候 能 力 不 足 ,人 迫切 需要 各 类 数据 的 全 面 融 
合 来 支撑 复杂 的 ,涉及 范围 较 广 的 问题 的 解决 。 结 合 城市 管理 的 实际 业务 ， 
将 来 在 数据 融合 方面 ,需要 对 各 种 数据 进行 动态 关联 、 交 叉 印 证 ,确保 数据 
的 鲜 活 性 与 统一 性 ,为 实现 城市 管理 提供 客观 、 全 面 、 准 确 的 数据 支撑 。 


33 智慧 城市 多 源 信 息 协 同体 系 的 理论 框架 


331 当前 智慧 城市 建设 存在 的 主要 问题 


目前 ,国内 外 的 智慧 城市 建设 已 初 具 规模 ,相关 技术 和 产业 发 展 迅速 , 信 
息 化 对 城市 化 的 引领 和 促进 效应 凸显 。 但 是 ,关于 智慧 城市 的 理论 研究 还 不 
成 熟 ,没有 形成 完整 的 理论 体系 ,主要 存在 三 个 方面 的 问题 : 一 是 顶层 设计 和 
总 体 规 划 层 面 缺 乏 科 学 的 方法 论 指导 ,二 是 建设 模式 与 实施 路 径 上 缺乏 成 功 
的 案例 ,三 是 在 大 部 分 技术 环节 和 应 用 领域 中 尚未 形成 统一 的 标准 。 

国外 的 智慧 城市 建设 具有 明显 的 地 区 特色 ,单一 领域 的 应 用 较为 深入 
和 成 熟 , 但 没有 形成 通用 性 的 、 规 模 性 的 智慧 应 用 和 服务 。 国 内 的 情况 则 恰 
恰 相反 ,主要 表现 出 三 个 特点 : 一 是 大 多 数 智慧 城市 的 规划 比较 相近 ,在 设 
计 上 “大 ”而 “全 ”, 缺 少 地 区 特色 的 结合 和 地 域 间 的 差异 性 ;二 是 部 分 智慧 城 
市 的 建设 过 于 依赖 IBM 等 国外 企业 的 支撑 。 由 于 国外 新 一 代 信 息 技术 的 应 
用 发 展 和 智慧 城市 建设 本 身 也 在 探索 过 程 之 中 ,相关 理论 和 技术 均 不 成 熟 ， 
且 国 内 外 的 国情 和 体制 完全 不 同 ,面临 的 社会 问题 重点 不 同 , 信 息 化 和 城市 
化 的 发 展 思路 与 环境 也 有 较 大 差别 ,因此 完全 照搬 国外 智慧 城市 的 建设 模 
式 并 不 合理 ;三 是 国内 的 智慧 城市 建设 目前 多 数 仍然 停留 在 数字 城市 阶段 ， 
不 乏 大 量 的 “面子 工程 ”和 ”政绩 工程 ”, 虽 然 举 着 “智慧 城市 ?的 大 旗 , 实 际 上 
做 的 都 是 在 "数字 城市 ?阶段 早 就 应 该 解决 的 问题 ,许多 城市 部 门 间 的 信息 
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共享 渠道 仍然 没有 打通 ,甚至 有 的 地 区 尚未 实现 办 公文 档 的 电子 化 ,也 跟风 
出 台 了 一 系列 智慧 城市 的 发 展 规划 ,存在 明显 的 “大 跃进 ”现象 。 

从 总 体 上 看 ,国内 外 关于 城市 信息 化 的 发 展 方向 主要 分 为 三 个 方面 : 一 
是 从 城市 地 理 或 地 理 信息 系统 (GIS) 的 角度 ,研究 信息 化 背景 下 的 城市 空间 
结构 变化 ,以 及 城市 空间 信息 系统 及 其 体系 结构 和 技术 架构 ;二 是 从 城市 规 
划 管 理 的 角度 ,研究 在 城市 规划 、 建 设 . 管 理 与 服务 中 的 信息 化 应 用 与 运行 
模式 ;三 是 从 城市 社会 经 济 发 展 的 角度 ,研究 信息 化 对 城市 社会 经 济 生活 各 
个 方面 的 影响 .带动 作用 及 如 何 有 效应 用 信息 技术 和 信息 服务 促进 城市 的 
全 面 发 展 。 通 过 分 析 可 以 发 现 , 在 城市 空间 信息 系统 的 体系 架构 、 城 市 规划 
层面 的 信息 化 应 用 、 面 向 城市 经 济 发 展 和 社会 管理 的 信息 技术 应 用 和 信息 
服务 中 均 涉及 多 源 信息 的 协同 和 联动 ,信息 协同 问题 是 城市 信息 化 发 展 的 
共性 问题 ,也 是 最 核心 的 环节 。 

目前 ,国内 外 的 信息 协同 技术 发 展 比 较 成 熟 ,但 在 城市 和 区 域 层面 的 信 
息 协 同 应 用 相对 较 少 ,尚未 形成 有 代表 性 的 案例 和 模式 。 主 要 存在 以 下 几 
个 方面 的 问题 : 

(1) 没有 建立 起 统一 的 信息 协同 标准 体系 框架 , 且 在 关键 的 共性 问题 
(如 实时 信息 的 分 类 、 基 础 信息 的 属性 和 编码 、 多 源 信息 的 接 人 与 传输 等 ) 上 
没有 形成 统一 的 标准 。 智 慧 城市 区 别 于 数字 城市 和 传统 城市 的 突出 特点 在 
于 大 量 存在 的 传感器 和 移动 设备 及 由 感知 端 和 移动 端 产生 的 海量 实时 信 
息 ,对 基础 信息 和 实时 信息 的 多 维度 、 精 细 化 管理 是 智慧 城市 管理 的 重要 基 
础 。 目 前 ,国内 外 在 信息 共享 和 传输 等 技术 层面 存在 多 种 国际 标准 、 国 家 标 
准 和 行业 标准 ,在 市 政 管理 .交通 管理 .公安 水务、 安全 生产 等 城市 基础 运 
行 管理 的 不 同 领域 形成 了 传感器 类 别 编码 标准 等 实 操 性 较 强 的 地 方 标准 和 
行业 标准 ,但 是 上 述 标准 的 领域 性 普遍 较 强 ,没有 形成 基于 业务 特点 的 共性 
需求 ,在 城市 和 区 域 层 面 上 尚 不 具有 通用 性 。 

(2) 城市 系统 下 的 信息 协同 模式 不 能 适应 智慧 城市 大 数据 决策 和 精细 
化 管理 的 需求 。 目 前 城市 系统 下 的 信息 流转 模式 比较 单一 (以 中 心 主导 的 


管理 模式 为 主 ) ,感知 信息 、 事 件 信 息 和 决策 信息 的 流向 相对 固定 ,一 方面 不 
足以 应 对 秒 级 (甚至 毫秒 级 ) 的 海量 物 联 信息 产生 和 流转 频率 , 男 一 方面 也 
造成 了 信息 资源 的 重复 流转 和 多 次 整合 ,协同 效率 低下 。 同 时 ,面向 智慧 城 
市 大 数据 特征 的 信息 协同 总 体 架 构 和 关键 技术 需要 重新 定义 ,以 便 能 够 灵 
活 地 支撑 多 种 信息 协同 模式 的 自 适应 过 程 ,以 应 对 智慧 城市 管理 对 快速 决 
策 、 应 急 指 挥 和 精细 化 管理 提出 的 新 的 需求 。 

(3) 作为 具有 导向 作用 的 城市 信息 化 测度 体系 方面 的 发 展 相 对 滞后 ,应 
用 主要 集中 在 总 体 层面 ,缺少 对 结构 层面 的 分 析 。 总 体 层面 的 测度 主要 关 
注 总 量 指标 ,如 信息 共享 目录 和 信息 需求 日 录 的 变化 情况 ,信息 节点 接 入 信 
息 交 换 技术 通道 的 情况 、 信 息 协同 的 需求 响应 情况 、 信 息 协同 技术 流程 与 业 
务 流程 的 关联 情况 等 ,测度 的 重点 是 信息 协同 的 及 时 性 (需求 响应 度 ) ,协同 
信息 的 质量 (信息 的 准确 性 、 连 续 性 、 匹 配 度 ) 和 多 源 信息 之 间 的 关联 度 。 而 
结构 层面 的 测度 主要 关注 个 体 及 其 之 间 的 关系 ,重点 分 析 城 市 系统 下 信息 
协同 网 络 结构 中 不 同 信息 组 织 的 差异 性 和 信息 组 织 之 间 的 关系 。 总 体 测 度 
与 结构 测度 的 关系 可 以 类 比 为 某 个 国家 或 地 区 的 GDP 水 平 与 基尼 系数 之 
间 的 关系 。 

(4) 城市 系统 下 的 多 源 信息 融合 应 用 尚 处 于 初级 阶段 。 一 方面 ,信息 融 
合 在 传感器 领域 研究 相对 较 多 ,在 信息 管理 领域 研究 不 足 , 只 有 需求 比较 单 
一 的 信息 关联 整合 应 用 ,缺少 结合 情景 的 .事件 驱动 的 复杂 实证 研究 ; 另 一 
方面 ,信息 组 织 内 部 的 信息 融合 居多 , 跨 部 门 、 跨 层级 、 跨 领域 的 信息 融合 较 
少 , 且 缺少 对 信息 融合 技术 层面 与 建 模 方案 的 深入 分 析 。 


332 智慧 城市 多 源 信息 协同 的 理论 模型 


面向 城市 和 区 域 层面 的 多 源 信息 协 同体 系 重点 探讨 信息 在 城市 系统 中 
的 协同 模式 及 其 相关 的 标准 ,机制 . 技 术 、 模 型 和 策略 ,从 信息 流 的 角度 探讨 
信息 化 对 城市 运行 和 精细 化 管理 的 提升 作用 。 智 慧 城 市 多 源 信息 协同 的 理 
论 模型 如 图 3. 1 所 示 。 
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智慧 城市 多 源 信 息 协 癌 的 评价 体系 
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图 3.1 智慧 城市 多 源 信息 协同 的 理论 模型 


由 图 3. 1 可 知 ,智慧 城市 多 源 信息 协同 体系 主要 由 信息 协同 标准 、 信 息 
协同 模式 、 信 息 协 同 评价 三 个 层次 构成 。 其 中 ,信息 协同 标准 是 信息 协同 模 
式 的 共性 规范 和 约束 ,同时 指导 信息 协同 的 评价 , 即 信息 协同 网 络 的 测度 过 
程 ; 信 息 协 同 模式 与 信息 协同 评价 之 间 形 成 城市 系统 下 信息 流转 的 闭环 流 
程 ,根据 信息 协同 网 络 的 测度 结果 进行 信息 协同 模式 的 智能 优化 。 

智慧 城市 多 源 信息 协同 体系 的 核心 环节 主要 包括 三 个 方面 : 

(1) 信息 协同 的 标准 体系 框架 及 其 关键 标准 : 通过 标准 体系 将 智慧 城 
市 运行 管理 所 涉及 的 人 、 地 、 事 、 物 ,组 织 用 信息 关联 起 来 ,实现 信息 协同 相 
关 物 联 实体 的 唯一 标识 和 物 联 信息 的 统一 调度 。 

(2) 信息 协同 的 模式 和 总 体 架构 : 根据 智慧 城市 的 大 数据 特征 和 需求 ， 
选择 不 同业 务 需 求 下 的 信息 协同 模式 ,通过 改变 信息 的 流向 对 传统 模式 下 
的 信息 流转 进行 优化 ,从 体系 、 功 能 、 数 据 和 接口 层面 建立 能 够 灵活 适应 多 
种 信息 协同 模式 的 总 体 架构 ;根据 信息 协同 不 同 阶 段 的 特点 建立 信息 流转 
的 自 适应 进程 ,实现 信息 协同 技术 流程 与 业务 流程 的 分 离 ,最终 实 现 信息 在 
城市 系统 中 智慧 地 流转 。 

(3) 信息 协同 网 络 的 结构 测度 和 优化 策略 : 对 城市 系统 下 的 多 源 信 息 
协同 网 络 结构 进行 科学 \ 有 效 的 测度 ,包括 信息 组 织 的 差异 测度 和 信息 组 织 
间 的 关系 测度 ,并 从 横向 和 纵向 两 个 层面 进行 协同 模式 优化 。 

智慧 城市 多 源 信息 协同 体系 的 研究 处 在 城市 化 和 信息 化 的 交叉 领域 ， 
涉及 城市 管理 .信息 科学 .计算 科学 .系统 科 学 .决策 科学 、 模 糊 数学 .统计 
学 .社会 网 络 分 析 等 多 个 学 科 ,是 一 个 非常 复杂 的 系统 工程 。 


333 智慧 城市 多 源 信息 协同 体系 的 理论 与 实践 意义 


1. 从 信息 视角 解读 智慧 城市 运行 管理 的 内 涵 和 机 理 

智慧 城市 作为 一 个 开放 的 复杂 巨 系 统 , 信 息 的 协同 是 保障 其 他 资源 要 
素 优化 配置 的 基础 ,是 城市 系统 更 加 智慧 运行 的 前 提 。 当 前 ,智慧 城市 建设 
在 解决 一 个 个 信息 孤岛 的 同时 ,不 可 避免 地 又 形成 了 领域 间 的 新 的 智慧 孤 
岛 。 从 信息 协同 的 角度 重新 解构 智慧 城市 运行 管理 面临 的 问题 和 挑战 , 通 
过 信息 的 流转 分 析 不 同事 件 驱 动 和 不 同 场景 边界 下 的 城市 运行 资源 调度 ， 
对 诠释 智慧 城市 的 内 涵 和 机 理 具 有 重要 的 理论 意义 。 

2 为 城市 和 区 域 层面 的 信息 协同 体系 建设 提供 理论 依据 和 方法 

1) 为 城市 运行 管理 领域 的 信息 协同 标准 提供 理论 依据 和 方法 

智慧 城市 运行 管理 的 信息 协同 标准 体系 是 对 智慧 城市 标准 体系 的 扩展 
和 细 化 ,为 城市 运行 领域 和 信息 协同 领域 的 系列 标准 建设 提供 了 内 部 结构 
和 外 部 接口 上 的 参考 。 信 息 协同 的 关键 标准 为 相关 领域 技术 标准 的 制定 提 
供 了 理论 依据 和 方法 。 

2) 为 智慧 城市 的 信息 协同 水 平 测度 提供 方法 论 的 支撑 

智慧 城市 多 源 信息 协同 的 结构 测度 可 以 弥补 总 体 测度 的 不 足 , 为 分 析 
城市 信息 协同 网 络 的 内 在 结构 及 其 关系 提供 合理 有 效 的 方法 和 路 径 ; 同 
时 ,在 差异 测度 和 关系 测度 基础 上 的 相应 优化 策略 是 信息 协同 模式 自 适 应 
过 程 的 理论 基础 。 

3. 为 大 中 型 智慧 城 市 建设 的 信息 化 顶层 设计 提供 支撑 

以 跨 部 门 、 跨 领域 . 跨 层级 的 信息 共享 、 流 转 和 整合 为 基础 的 信息 协同 
模式 和 通用 体系 架构 可 以 应 用 于 地 方 大 中 型 智慧 城市 规划 和 建设 中 ,从 协 
同 模 式 、 协 同 机 制 和 技术 架构 三 个 层面 上 指导 智慧 城市 的 信息 化 顶层 设计 ， 
从 信息 流 的 角度 为 全 面 掌控 城市 系统 运行 情况 、 提 高 城市 精细 化 管理 水 平 

和 应 急 决 策 水 平 提供 有 效 支撑 。 
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第 4 章 ”智慧 城市 多 源 信息 协同 的 标准 体系 


城市 系统 是 一 个 开放 的 复杂 巨 系统 。 在 后 面 的 三 章 中 ,将 以 智慧 城市 
为 对 象 , 分 别 曾 述 多 源 信息 协 同 的 标准 体系 、 协 同 模式 和 总 体 架 构 。 

信息 协同 标准 是 多 源 信息 协同 体系 的 基础 ,对 信息 协同 的 模式 和 评价 
进行 规范 性 约束 。 本 章 重 点 介绍 信息 协同 的 标准 体系 框架 及 其 关键 标准 ， 
通过 标准 体系 将 智慧 城市 所 涉及 的 人 、 地 、 事 、 物 、 组 织 用 信息 关联 起 来 ,最 
终 实 现 智慧 城市 系统 中 所 有 实体 的 唯一 标识 和 相关 信息 的 统一 调度 。 


41 智慧 城市 标准 化 现状 


41.1 主要 的 信息 化 标准 化 组 织 


1. 国际 信息 化 标准 化 组 织 

国际 上 的 信息 化 标准 化 组 织 主 要 有 国际 标准 化 组 织 (ISO) 、 国 际 电工 委 
员 会 (IEC) ,国际 物品 编码 协会 (GSD .美国 电气 和 电子 工程 师 协 会 (IEEE)、 
国际 电报 联盟 (ITU) .欧洲 电信 标准 化 协会 (ETSI) 等 。 

1) ISO/IEC 

国际 标准 化 组 织 (International Organization for Standardization. ISO) 
成 立 于 1947 年 2 月 23 日 ,是 世界 上 国际 标准 最 大 的 推动 者 。 中 国 加 入 ISO 
的 时 间 是 1978 年 ,并 在 2008 年 10 月 的 第 31 届 国 际 化 标准 组 织 大 会 上 正式 
成 为 ISO 的 常任 理事 国 。 代 表 中 国 参加 ISO 的 国家 机 构 是 国家 标准 化 管理 
委员 会 。 

国际 电工 委员 会 (International Electrotechnical Commission ,IEC) 是 国 
际 性 电工 标准 化 机 构 ,负责 有 关 电 气 工程 和 电子 工程 领域 中 的 国际 标准 化 
TE. IEC 与 ISO 有 密切 的 联系 ,ISO 和 IEC 作为 一 个 整体 担负 着 制订 全 球 


协商 一 致 的 国际 标准 的 任务 。 代 表 中 国 参加 IEC 的 国家 机 构 是 国家 标准 化 
管理 委员 会 。 

ISO/IEC 开展 的 相关 信息 化 标准 化 工作 有 : 针对 RFID、 智 能 传感器 等 
物 联网 相关 关键 领域 开展 了 标准 化 工作 ; ISO 成 立 了 智能 电网 特殊 组 ; IEC 
制定 了 智能 传感器 标准 体系 ; ISO/IEC 成 立 了 联合 技术 委员 会 (JTC) ,针对 
标识 、RF 接口 .数据 采集 等 开展 工作 ; ISO/IEC JTC 成 立 了 特殊 组 WG7 , 专 
门 研究 传感器 网 络 相关 标准 。 

2) GSI 

GS1 (Globe Standard 1) 即 国际 物品 编码 协会 , 其 前 身 为 EAN 
International, IÈ F 1977 年 ,是 基于 比利时 法 律 规定 建立 的 一 个 非 营利 性 
质 的 国际 组 织 ,总 部 设 在 比利时 首都 布鲁塞尔 。GSI 在 108 个 国家 设 有 办 事 
处 ,有 超过 2000 个 专业 人 员 o 

2003 年 11 月 1 日 ,国际 物品 编码 协会 正式 接管 了 EPC (Electronic 
Product Code, 产 品 电 子 代码 ) 在 全 球 的 推广 应 用 工作 ,成 立 了 EPC global， 
负责 管理 和 实施 全 球 的 EPC 工作 。 在 我 国 ,EPC global 授权 中 国 物品 编码 
中 心 作为 唯一 代表 负责 我 国 EPC 系统 的 注册 管理 ,维护 及 推广 应 用 工作 。 
同时 , EPC global F 2003 年 11 月 1 日 将 Auto-ID 中 心 更 名 为 Auto-ID 
Lab. EPC global 提供 技术 支持 。 

此 外 EPC global 还 负责 : 参与 EPC 商业 应 用 案例 实施 和 EPC global 
网 络 标准 的 制订 ;参与 EPC global 网 络 、 网 络 组 成 .研究 开发 和 软件 系统 等 
的 规范 制订 和 实施 ;引领 EPC 研究 方向 ;认证 和 测试 ;与 其 他 用 户 共同 进行 
试点 和 测试 。 

3) IEEE 

美国 电气 和 电子 工程 师 协 会 (Institute of Electrical and Electronics 
Engineers.,IEEE) 在 1963 年 1 月 1 日 由 美国 无 线 电 工程 师 协会 (IRE) 和 美 
国电 气 工程 师 协会 (AIEE) 合 并 而 成 ,总 部 在 美国 纽约 市 。IEEE 拥有 300 
多 个 地 方 分 会 ,这 些 分 会 分 布 在 150 多 个 国家 。 
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IEEE 被 国际 标准 化 组 织 授 权 为 可 以 制定 标准 的 组 织 , 设 有 专门 的 标准 
工作 委员 会 ,参与 标准 的 研究 和 制定 的 工作 人 员 达 30 000 多 人 ,每 年 制定 和 
修订 800 多 个 技术 标准 。IEEE 定义 的 标准 在 工业 界 有 极 大 的 影响 。 其 中 
802 委员 会 于 1980 年 2 月 成 立 , 在 制定 局 域 网 的 国际 标准 方面 成 绩 显著 。 

IEEE 开展 的 相关 信息 化 标准 化 工作 有 : IEEE 802 系列 标准 是 IEEE 
802 LAN/MAN 标准 委员 会 制订 的 局 域 网 、 城 域 网 技术 标准 ,其 中 的 IEEE 
802.15 工作 组 专门 从 事 无 线 个 人 局 域 网 (WPAN) 标 准 化 工作 ,IEEE 的 
802. 15 工作 组 也 是 目前 物 联网 领域 在 无 线 传 感 网 层面 的 主要 标准 化 组 织 之 

。 目 前 ,传感器 应 用 最 广泛 的 ZigBee 采用 IEEE 802. 15. 4 标准 作为 物理 
层 和 媒体 存 取 控 制 层 的 标准 。 

4) ITU 

国际 电信 联盟 (International Telegraph Union ,ITU) 是 联合 国 的 一 个 专 
门 机 构 , 其 总 部 在 日 内 瓦 。 它 由 电信 标准 化 部 门 (ITU-T)、 无 线 通 信 部 门 
(ITU-R) 和 电信 发 展 部 门 (ITU-D) 组 成 。 其 中 ,电信 标准 化 部 门 由 原来 的 
CCITT 和 从 事 标准 化 工作 的 部 门 CCIR 合并 而 成 ,主要 职责 是 研究 电信 技 
术 .操作 和 资费 等 问题 ,并 出 版 了 建议 书 , 目 的 是 在 世界 范围 内 实现 电信 标 
准 化 。 

ITU 开展 的 相关 信息 化 标准 化 工作 有 : ITU-TSG 11 主要 研究 标签 和 
USN 测试 ; ITU-TSG13 主要 研究 NGN 架构 对 RFID 标签 应 用 的 支持 ,以 
及 泛 在 网 和 泛 在 传感器 网 络 需求 和 架构 ;ITU-TSG16 主要 研究 标签 和 
USN .UN 业务 相关 工作 ;ITU-TSG 17 开展 针对 标签 . 泛 在 网 和 泛 在 传感器 
网 络 安全 方面 的 工作 ;此 外 还 有 智能 电网 、 智 能 交通 和 IoT 焦点 工作 组 。 

5) ETSI 

欧洲 电信 标准 化 协会 (European Telecommunications Standards 
Institute,ETSI) 是 一 个 非 营 利 性 的 电信 标准 化 组 织 , 在 1988 年 由 欧盟 批准 
建立 ,总 部 设 在 法 国 尼斯 。ETSI 的 标准 化 领域 主要 是 电信 业 , 另 外 对 信息 
及 广播 技术 领域 也 有 所 涉及 ,但 主要 是 与 其 他 组 织 合 作 。ETSI 获得 了 CEN 


(欧洲 标准 化 协会 ) 和 CEPT( 欧 洲 邮 电 主 管 部 门 会 议 ) 的 认可 ,欧盟 常 把 
ETSI 制定 的 推荐 性 标准 作为 欧洲 法 规 的 技术 基础 而 采用 并 要 求 执行 。 

相 比 ITU, ETSI 具有 很 大 的 公众 性 和 开放 性 ,主管 部 门 、 用 户 、 运 营 商 、 
研究 机 构 都 可 以 平等 地 发 表意 见 。 另 外 , 它 与 ITU 的 不 同 之 处 还 在 于 ETSI 
对 市 场 敏感 ,根据 市 场 和 用 户 的 需求 制定 标准 ,针对 性 和 时 效 性 较 强 。ITU 
在 制定 标准 时 , 常 留 有 许多 任 选项 给 不 同 国家 和 地 区 进行 选择 ,其 结果 是 不 
便于 设备 的 统一 和 互通 。ETSI 针对 欧洲 市 场 和 世界 市 场 的 情况 ,深入 细 化 
指标 ,避免 了 上 述 问题 。 

ETSI 开展 的 相关 信息 化 标准 化 工作 有 : ETSI 在 2008 年 11 月 成 立 了 
M2M 技术 委员 会 (M2M Technical Committee, M2M TC) ,其 主要 职责 是 收 
集 和 定义 M2M 需求 .架构 ,补充 现 有 标准 没有 覆盖 的 M2M 的 需求 ,并 对 这 
些 需求 进行 标准 化 。M2M TC 的 主要 工作 包括 M2M 设备 标识 、 名 址 体系 、 
QoS, 安 全 隐私 、 计 费 , 管 理 , 应 用 接口 .硬件 接口 互 操作 等 。 

6) 3GPP 

第 三 代 合 作 伙 伴 计 划 (The 3rd Generation Partnership Project, 3GPP) 
标准 组 织 创建 于 1998 年 12 月 。3GPP 的 组 织 伙 伴 包括 欧洲 的 ETSI, H Æ 
的 ARIB. 日 本 的 TTC、 韩 国 的 TTA ,美国 的 TI 和 中 国 通信 标准 化 协会 六 个 
标准 化 组 织 。3GPP 致力 于 3G 及 长 期 演进 分 组 域 网 络 的 研究 。 

3GPP 在 这 方面 的 工作 包括 : GERAN (GSMEDGE Radio Access 
Network) 研 究 通过 增强 和 优化 GERAN 支持 M2M 通信 ;RAN (Residential 
Access Network) 研 究 通 过 增强 和 优化 UTRAN/E-UTRAN 支持 M2M Ñ 
信 ;SA1 负责 确定 M2M 通信 的 基本 需求 .业务 需求 和 MTC FeaturesSA2 fi 
责 研 究 M2M 通信 网 络 架构 及 网 络 优化 ;SA3 负责 研究 M2M 通信 中 的 安全 
问题 。 

2 国内 信息 化 标准 化 组 织 

国内 制定 信息 化 标准 的 机 构 主 要 包括 中 国 通信 标准 化 协会 (CCSA)、 国 
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家 标准 委员 会 传感器 网 络 标准 工作 组 (WGSN) 工业 和 信息 化 部 电子 标签 
(RFID) 标 准 工作 组 以 及 各 行业 标准 化 组 织 。 

1) 中 国 通信 标准 化 协会 (CCSA) 

中 国 通信 标准 化 协会 (China Communications Standards Association， 
CCSA) 于 2002 年 12 月 18 日 成 立 。CCSA 是 国内 企 . 事 业 单位 自愿 联合 组 
织 起 来 ,经 业务 主管 部 门 批准 ,国家 社团 登记 管理 机 关 登 记 ,开展 通信 技术 
领域 标准 化 活动 的 非 营利 性 法 人 社会 团体 。 

CCSA 的 主要 任务 是 更 好 地 开展 通信 标准 研究 工作 ,把 通信 运营 企业 、 
制造 企业 、 研 究 单位 ,大 学 等 关心 标准 化 的 企 事业 单位 组 织 起 来 ,按照 公平 、 
公正 、 公 开 的 原则 制订 标准 ,进行 标准 的 协调 ,把 关 , 把 高 技术 、 高 水 平 . 高 质 
量 的 标准 推荐 给 政府 ,把 具有 中 国 自 主 知识 产权 的 标准 推 向 世界 ,支撑 中 国 
的 通信 产业 ,为 世界 通信 做 出 贡献 。 

CCSA 开展 的 物 联 网 相关 工作 包括 : TC3 开展 了 泛 在 网 的 需求 和 架构 、 
M2M 业务 相关 的 标准 工作 ;TC5 开展 了 WSN 与 电信 网 结合 的 总 体 技术 要 
RTD 网 关 设备 要 求 相关 的 标准 工作 ;TC5 开展 了 机 器 类 通信 安全 相关 的 
标准 工作 ;TC10 泛 在 网 技术 工作 委员 会 ,包括 总 体 工作 组 、 应 用 工作 组 、 网 
络 工作 组 ,感知 延伸 工作 组 ,专门 研究 泛 在 网 相关 的 标准 工作 。 

2) 传感器 网 络 标准 工作 组 (WGSN) 

传感器 网 络 标准 工作 组 (WGSN) 是 从 事 传 感 器 网 络 标准 化 工作 的 全 国 
性 技术 组 织 ,成 立 于 2000 年 9 月 11 日 .由 国家 标准 化 管理 委员 会 批准 筹建 ， 
由 全 国信 息 ,技术 标准 化 技术 委员 会 批准 成 立 并 领导 。 

传感器 网 络 标准 工作 组 的 主要 任务 是 根据 国家 标准 化 工作 的 方针 政 
策 ,研究 并 提出 有 关 传 感 网 标准 化 工作 方针 、 政 策 和 技术 措施 的 建议 ;按照 
国家 标准 制定 ,修订 原则 ,制订 和 完善 传 感 网 的 标准 体系 表 。 工 作 组 提出 和 
修订 传 感 网 国家 标准 的 长 远 规划 和 年 度 计划 的 建议 ;根据 批准 的 计划 ,组 织 
传 感 网 国家 标准 的 制定 ,修订 工作 及 其 他 与 标准 化 有 关 的 工作 。 


3) RFID 标准 工作 组 

RFID 标准 工作 组 在 原 信 息 产业 部 科技 司 领导 下 开展 工作 ,专门 致力 于 
中 国 REID 领域 的 技术 研究 和 标准 制订 ,信息 产业 部 电子 标签 标准 工作 组 成 
立 于 2005 年 10 月 ,下 设 7 个 工作 组 ,包括 总 体 组 (47 家 ) MESES RA 
(48 R) ,频率 与 通信 组 (26 家 ) ,数据 格式 组 (14 家 ) 、 应 用 组 (52 家 ) 信息 安 
全 组 (18 家 )、 知 识 产权 组 (4 家 )。 目 前 我 国正 在 研究 和 制定 的 标准 超过 
40 项 。 

电子 标签 标准 工作 组 提出 了 中 国 的 RFID 标准 体系 ( 见 图 4.1) .并 有 针 
对 性 地 开展 了 研究 ,我 国 RFID 市 场 规模 已 居 全 球 第 三 位 。 


中 国 RFID 
标准 体系 
I 
协 中 设 安 应 
i 议 间 备 全 | | 用 
类 类 类 类 类 | ”| 类 
| a ee 
: 空中 | 应 用 i 系统 
术语 || 编码 软件 || 网 络 | 标 等 || 恋 写 各 类 
ie || 标准 || n || 层 协 标签 安全 
标准 || 标准 || FPO ||” || 系统 || 服务 器 管理 | 应 有 


图 4.1 中 国 RFID 标准 体系 


电子 标签 标准 工作 组 成 员 单位 参与 制定 的 RFID 标准 主要 有 《GB 
18937 一 2003 全 国产 品 与 服务 统一 标识 代码 编制 规则 》《TB/T 3070 一 2002 
铁路 机 车 车 辆 自动 识别 设备 技术 条 件 ) 以 及 在 上 海 市 使 用 的 ( 送 检 动物 电子 
标示 通用 技术 规范 》。 

RFID 标准 工作 组 目前 已 经 公布 的 相关 RFID 标准 主要 有 参照 ISO/ 
TEC 15693 标准 的 识别 卡 和 无 触 点 的 集成 电路 卡 标准 , 即 (GB/T 22351.,1 一 
2008 识别 卡 无 触 点 的 集成 电路 卡 邻近 式 卡 第 1 部 分 : 物理 特性 》 和 《GB/T 
22351,3 一 2008 识别 卡 无 触 点 的 集成 电路 卡 邻 近 式 卡 第 3 部 分 : 防 冲突 和 
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传输 协议 》。 

4) 中 国电 子 技术 标准 化 研究 所 

中 国电 子 技术 标准 化 研究 所 ( 原 信 息 产 业 部 电子 工业 标准 化 研究 所 、 信 
息 产 业 部 电子 第 四 研究 所 ,简称 CESI) 是 国际 电子 技术 标准 化 权威 研究 
机 构 。 

该 所 长 期 参与 国际 标准 化 活动 ,承担 了 多 项 重要 的 安全 和 电磁 兼容 国 
家 标准 (如 GB9254 ,GB4943 .GB/T17618,GB/T6113 系列 ) 和 国家 军用 标准 
(如 GJB151/152、GJB151A/152A) 的 制定 和 修订 工作 ,对 相关 标准 条 款 有 最 
终 解释 权 , 对 标准 的 理解 和 使 用 具有 特殊 的 优势 。 


41.2 全 球 智慧 城市 标准 化 现状 


ISO IEC ITU-T 均 在 积极 推动 智慧 城市 标准 化 工作 。2012 年 2 月 23 
日 ,ISO 响应 联合 国 、 世 界 银 行 等 国际 组 织 以 及 世界 各 国 对 可 持续 发 展 标准 
化 的 需求 ,批准 成 立 了 ISO/TC268 社区 可 持续 发 展 技术 委员 会 (Sustainable 
Development in Communities) ,目的 是 为 推动 世界 各 国 城市 (社区 ) 实 现 可 
持续 发 展 ,为 各 类 城市 (社区 ) 提供 支撑 技术 和 工具 ,包括 管理 体系 要 求 、 指 
南 和 相关 标准 。ISO/TC268 围绕 城市 和 社区 可 持续 发 展 ,组 建 了 ISO/ 
TC268SC1 城市 智能 基础 设施 计量 分 技术 委员 会 (Smart Urban 
Infrastructure Metrics) ,负责 制定 城市 (社区 ) 基 础 设施 计量 的 标准 。2011 
年 日 本 向 ISO TMB 提出 了 衡量 城市 (社区 ) 基 础 设施 智能 程度 的 评估 方法 ， 
对 城市 智能 基础 设施 的 定义 .范围 .计量 方法 等 内 容 提出 了 具体 要 求 ,目的 
是 通过 定量 分 析 的 方法 衡量 城市 能 源 . 水 交通 及 ICT 等 城市 基础 设施 , 目 
前 正在 围绕 城市 (社区 ) 基 础 设施 标准 的 范围 .术语 .定义 及 通则 等 方面 制订 
建议 草案 。 在 2013 年 2 月 ,ITU-T 建立 了 一 个 新 的 针对 智慧 城市 可 持续 发 
展 问 题 的 专题 评估 小 组 ,用 以 评估 智慧 城市 标准 化 工作 。2013 年 6 H, 
IECSMB 同意 设立 智慧 城市 的 系统 评价 小 组 ,2013 年 7 月 9 日 在 日 本 召开 
了 第 一 次 工作 会 议 。 


欧美 各 国都 在 积极 开展 国家 或 区 域 智 慧 城市 标准 化 工作 。CEN/ 
CENLEC(Comité Européen de Normalization ,欧洲 标准 委员 会 /European 
Committee for Electrotechnical Standardization ,欧洲 电工 标准 化 委员 会 )、 
BSI(Britain Standards Institute, 英国 标准 协会 )、DIN (Deutsches Institut 
fiir Normung, 德国 标准 化 协会 )、ANSI (American National Standards 
Institute, 美 国 国家 标准 学 会 ) 等 地 区 或 国家 标准 化 机 构 纷纷 提出 了 智慧 城 
市 标准 化 战略 定位 .体系 框架 和 参考 模型 。2012 年 ,BSI 提出 了 智慧 城市 标 
准 化 战略 ,目前 正在 推动 《智慧 城市 框架 : 智慧 城市 和 社区 决策 者 的 良好 做 
法 指南 ) 和 《智慧 城市 术语 ) 等 标准 的 研制 工作 。2013 年 4 月 ,CEN 及 
CENELEC 共同 成 立 了 可 持续 的 智慧 城市 和 社区 协调 小 组 (SSCCCG) ,加 速 
推进 欧洲 的 智能 城市 标准 化 进展 。2013 年 4 月 4 日 ,ANSI 召开 了 联合 会 员 
论坛 ,讨论 标准 和 一 致 性 解决 方案 在 促进 国家 和 国际 智慧 城市 建设 过 程 中 
发 挥 的 重要 作用 。2013 年 5 月 ,DIN 和 DKE( 德 国电 气 电工 信息 技术 委员 
会 ) 发 布 了 一 份 题 为 “德国 标准 化 路 线 图 : 智能 城市 和 社区 的 可 持续 发 展 ” 的 
报告 。 

亚洲 国家 也 纷纷 针对 智慧 城市 提出 了 各 国 的 标准 研究 计划 。2006 年 ， 
新 加 坡 推出 了 智慧 国 2015 计划 ,并 开始 研究 智慧 城市 标准 化 工作 。2007 
年 ,韩国 成 立 了 U-Eco City 的 研发 机 构 , 其 任务 之 一 是 研究 智慧 城市 的 标准 
化 工作 。2011 年 ,日 本 INOTEK 组 织 也 开始 研究 智慧 城市 标准 化 工作 。 从 
2011 年 开始 ,我国 国 家 标准 化 管理 委员 会 (SAC) 也 在 积极 开展 智慧 城市 标 
准 化 工作 。 


413 国内 智慧 城市 标准 化 现状 


智慧 城市 建设 的 标准 化 有 利于 提高 城市 规划 的 通用 性 ,降低 建设 成 本 ， 
有 利于 促进 产业 链 的 分 工 合作 ,加 强 各 政府 部 门 之 间 的 互联 互通 .共享 协 
同 ,推广 最 佳 的 技术 和 应 用 实践 。 
国内 智慧 城市 标准 体系 的 研究 和 关键 标准 的 制定 工作 与 国外 处 于 同步 
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发 展 阶段 ,主要 的 标准 化 机 构 和 组 织 包 括 国家 标准 化 管理 委员 会 
(Standardization Administration of China, SAC) ,全 国 通信 标准 化 技术 委员 
会 .全 国信 息 技术 标准 化 技术 委员 会 (TC28) 全国 智 能 建筑 及 居住 区 数字 化 
标准 化 技术 委员 会 (TC426)、 全 国 智能 运输 系统 标准 化 技术 委员 会 
(TC268) .中 国 通信 标准 化 协会 (CCSA ,TC10) ,全 国信 息 分 类 与 编码 标准 化 
技术 委员 会 (TC353) 等 。 

2013 年 10 月 ,SAC 联合 科技 部 开展 智慧 城市 标准 的 试点 .验证 和 示范 
工作 。2014 年 1 月 ,SAC 联合 9 个 部 委 启 动 智 慧 城市 国家 标准 体系 建设 工 
VE , 首 批 下 达 了 《智慧 城市 技术 参考 模型 》 等 五 项 国家 标准 ,以 指导 推进 智慧 
城市 国家 标准 制定 、 国 际 标准 化 工作 以 及 标准 服务 体系 建设 《智慧 城市 技 
术 参 考 模型 ) 适 用 于 智慧 城市 整体 规划 及 具体 领域 信息 化 项 目的 设计 、 开 
发 .运行 和 维护 ,是 指导 和 综合 应 用 智慧 城市 的 具体 技术 、 服 务实 现 标准 的 
依据 ,也 是 建立 智慧 城市 相关 质量 测评 标准 .工程 标准 及 应 用 标准 的 依据 。 

2014 年 7 月 ,全 国 首 批 17 个 智慧 城市 专项 联合 实验 室 揭牌 ,聚焦 城市 
基础 设施 ,城市 安全 ,水 务工 程 、 建 筑 节 能 、 智 能 交通 .公共 信息 平台 、 信 息 安 
全 、 信 息 技术 等 领域 的 科研 和 标准 建设 。 

同时 ,住房 和 城乡 建设 部 编制 了 《智慧 城市 评价 模型 及 基础 评价 指标 体 
系 ) 的 国家 标准 。《 智 慧 城市 评价 模型 及 基础 评价 第 1 部 分 : 信息 基础 设施 》 
由 全 国 通信 标准 化 技术 委员 会 牵头 负责 ,规定 智慧 城市 信息 基础 设施 评价 
对 象 . 范 围 和 指标 ,并 提出 相应 的 评价 指标 。 其 中 评价 指标 中 包括 技术 原则 
和 要 求 以 及 设计 与 使 用 原则 。 本 标准 适用 于 智慧 城市 整体 规划 及 信息 基础 
设施 项 目 建设 与 评价 ,是 指导 智慧 城市 具体 技术 .服务 实现 的 标准 依据 ,也 
是 建立 智慧 城市 相关 质量 测评 标准 .工程 标准 及 应 用 标准 的 依据 . 《智慧 城 
市 评价 模型 及 基础 评价 第 2 部 分 : 信息 化 应 用 和 服务 》 由 全 国信 息 技 术 标准 
化 技术 委员 会 牵头 负责 ,规定 智慧 城市 信息 化 应 用 与 服务 评价 模型 .评价 指 
标 , 适 用 于 智慧 城市 整体 规划 及 信息 化 应 用 与 服务 项 目 建设 与 评价 ,是 评估 
后 续 智 慧 城市 具体 应 用 与 服务 标准 的 依据 . 《智慧 城市 评价 模型 及 基础 评 


价 指标 体系 第 3 部 分 : 建设 管理 ?由 全 国 智 能 建筑 及 居住 区 数字 化 标准 化 技 
术 委员 会 牵头 负责 ,标准 中 建设 管理 内 容 主要 指 城市 建设 中 的 水 . 电 、 煤 气 
等 基础 设施 管 网 的 建设 标准 ,结合 移动 互联 网 、 物 联网 、 云 计算 等 先进 信息 
技术 与 城市 管理 运营 理念 ,致力 于 提高 城市 的 基础 设施 的 协同 化 .智慧 化 ， 
提供 城市 生活 的 舒适 度 。 

除 此 之 外 ,全 国信 息 技术 标准 化 技术 委员 会 牵头 负责 的 《智慧 城市 SOA 
标准 应 用 指南 ?规定 了 智慧 城市 的 SOA 应 用 参考 模型 及 智慧 城市 建设 中 
SOA 标准 的 综合 应 用 建议 ,适用 于 智慧 城市 整体 及 具体 领域 信息 化 项 目的 
规划 、 设 计 、 开 发 .实施 、 评 估 、 运 行 和 维护 ;全 国信 息 安全 标准 化 技术 委员 会 
负责 的 《信息 安全 技术 智慧 城市 建设 信息 安全 保障 指南 》 针 对 智慧 城市 建设 
带 来 的 数据 资源 集中 和 共享 所 面临 的 信息 安全 风险 ,进行 信息 安全 保障 体 
系 的 标准 制定 。 

在 地 方 城市 层面 ,部 分 省 市 已 开展 了 智慧 城市 标准 的 研究 和 先期 应 用 
浙江 省 、 上 海 市 南京 市 等 地 方 已 将 智慧 城市 标准 工作 纳入 工作 任务 ,并 成 
立 了 地 方 标准 化 组 织 ,积极 开展 智慧 城市 评价 指标 体系 、 体 系 结构 、 信 息 资 
源 目 录 和 交换 等 标准 规范 的 研究 工作 。 

根据 相关 公开 的 计划 和 进展 ,到 2016 年 年 底 国内 将 逐步 建立 健全 中 国 
智慧 城市 国家 标准 体系 。 其 中 ,共性 、 关 键 性 标准 主要 涵盖 数据 与 服务 融合 
平台 \ 主 数据 数据 挖掘 分 析 、 跨 系统 信息 交互 信息 资源 管理 与 信息 系统 运 
维 等 促进 系统 数据 与 服务 融合 的 领域 。 


42 信息 协同 标准 化 的 关键 问题 与 总 体 框架 


421 城市 化 信息 化 与 标准 化 协同 发 展 


2014 年 3 月 16 日 发 布 的 (国家 新 型 城镇 化 规划 (2014 一 2020 年 )》 明 确 
提出 了 推进 智慧 城市 建设 ,统筹 城市 发 展 的 物质 资源 、 信 息 资源 和 智力 资源 
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利用 ,推动 物 联网 、 云 计算 、 大 数据 等 新 一 代 信 息 技术 创新 应 用 ,实现 与 城市 
经 济 社会 发 展 深 度 融 合 的 理念 。 作 为 城市 发 展 的 高 级 阶段 ,智慧 城市 成 为 
信息 化 与 城市 化 高 度 融 合 的 最 佳 契 合 点 ,也 是 推进 城市 化 建设 的 战略 制 


高 点 。 


当前 ,我 国 的 智慧 城市 建设 处 于 基础 设施 建设 和 领域 示范 应 用 的 起 步 
阶段 ,智慧 城市 的 架构 模式 、 标 准 规范 .关键 技术 .评价 体系 等 均 不 成 熟 。 统 
计数 据 表明 ,目前 全 国 所 有 副 省 级 以 上 城市 超过 89% 的 地 级 及 以 上 城市 、 
超过 47% 的 县 级 及 以 上 城市 提出 了 智慧 城市 建设 的 设想 或 规划 。 但 是 ,在 
智慧 城市 的 实际 建设 过 程 中 ,普遍 面临 着 重 应 用 轻 规划 、 重 建设 轻 标 准 、 重 
技术 轻 规范 的 问题 。 从 顶层 设计 的 层面 上 构建 完整 .合理 的 标准 体系 框架 ， 
已 成 为 指导 智慧 城市 科学 建设 和 可 持续 发 展 的 关键 。 

根据 钱学森 、 于 景 元 、 戴 汝 为 在 (一 个 科学 新 领域 一 一 开放 的 复杂 巨 系 
统 及 其 方法 论 ) 中 的 定义 ,智慧 城市 是 一 个 开放 的 复杂 巨 系统 ,城市 系统 本 
身 与 系统 周围 的 环境 有 物质 、 能 量 和 信息 的 交换 ,同时 城市 系统 下 又 包含 数 
量 庞大 、 种 类 繁多 的 子 系统 。 智 慧 城市 的 标准 化 建设 是 促进 城市 各 利益 相 
关 方 达成 共识 的 基础 ,同时 也 是 促进 城市 产业 链 优 化 、 降 低 城 市 运行 成 本 、 
提升 城市 竞争 力 的 重要 保障 ;而 信息 协同 则 是 保障 城市 系统 中 其 他 资源 要 
素 优 化 配置 的 基础 ,是 城市 系统 更 加 智慧 运行 的 前 提 。 智 慧 城市 建设 需要 
城市 化 ,信息 化 和 标准 化 的 协同 发 展 ( 见 图 4. 2) 。 

物 联网 、 云 计算 ,移动 互联 网 、 大 数据 等 新 一 代 信息 技术 的 应 用 带 来 技 
术 变 革 的 深入 发 展 ,技术 标准 体系 建设 成 为 标准 壁垒 时 代 技 术 创新 的 重要 
支撑 。 随 着 信息 系统 的 泛 在 化 逐步 成 为 全 球 信息 化 向 高 端 发 展 的 主要 特 
征 , 城 市 管理 需要 城市 各 部 门 .各 领域 .各 主体 间 信息 的 互联 互通 ,信息 共享 
的 重要 性 日 益 凸 显 。 但 是 ,智慧 城市 的 建设 过 程 在 解决 一 个 个 “信息 孤岛 ” 
的 同时 ,不 可 避免 地 又 形成 了 领域 间 新 的 “智慧 孤岛 ", 各 领域 应 用 均 按 照 各 
自 的 管理 思路 和 标准 体系 建设 ,在 城市 和 区 域 层面 上 缺少 统筹 协调 。 智 慧 
城市 管理 的 信息 协同 标准 体系 成 为 城市 化 ,信息 化 和 标准 化 协同 发 展 蜡 待 


ht 


城市 标准 化 


言 息 协同 标 》 k ra SS 
bia la 智 志 城市 
7 信息 协同 标准 化 


信息 标准 化 
信息 化 


图 4.2 城市 化 ,信息 化 与 标准 化 协同 发 展 
解决 的 核心 问题 。 
422 智慧 城市 信息 协同 标准 的 关键 问题 


随 着 新 一 代 信息 技术 的 发 展 和 全 球 智 慧 城市 的 规模 化 建设 ,感知 设备 
越 来 越 多 地 应 用 在 城市 管理 的 各 个 层面 。 通 过 感知 设备 对 管理 对 象 的 实时 
感知 ,能 够 为 城市 运行 的 监管 和 服务 提供 更 快速 ,更 有 效 的 数据 支撑 。 面 对 
日 益 增多 ,分 布 在 城市 各 个 角落 的 大 量 传 感 设备 ,如 何 对 其 进行 科学 的 管 
理 , 同 时 加 强 感知 设备 和 感知 信息 的 共享 和 利用 ,保障 感知 信息 在 城市 系统 
下 合理 、 高 效 的 流转 ,是 智慧 城市 信息 协同 标准 体系 需要 解决 的 关键 问题 。 

第 一 , 物 联 实体 的 编码 是 智慧 城市 标准 化 建设 和 应 用 的 基础 。 一 方面 ， 
标准 的 编码 及 其 表示 方式 有 利于 感知 设备 ,管理 对 象 等 城市 运行 管理 中 物 
联 实体 的 唯一 识别 ; 另 一 方面 ,实时 感知 信息 是 物 联 信息 的 主体 部 分 ,通过 
编码 可 以 将 不 同时 间 采 集 的 信息 进行 统一 管理 ,实现 物 联 实体 的 实时 定位 。 

第 二 ,统一 的 基础 信息 属性 管理 是 城市 基础 设施 集约 化 建设 的 前 提 。 
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一 方面 ,属性 规范 有 利于 物 联 实体 管理 的 规范 化 和 标准 化 ,确立 编码 与 信息 
之 间 的 一 一 对 应 关系 ,从 而 保证 对 信息 表述 的 唯一 性 、 可 靠 性 和 可 比 性 ; 另 
一 方面 ,统一 的 基础 信息 属性 管理 有 利于 城市 基础 设施 的 重复 利用 和 有 效 
利 旧 , 可 以 大 幅 减 少 政府 和 市 场 的 投资 。 

第 三 , 物 联 信息 在 城市 系统 下 的 流转 需要 统一 模式 规范 和 技术 标准 ,并 
与 物 联 实体 的 基础 信息 属性 和 编码 标准 相关 联 。 一 方面 ,根据 实体 编码 规 
则 对 采集 信息 进行 不 同 维度 的 分 类 ,形成 有 效 的 信息 ,便于 在 信息 流转 过 程 
中 进行 整合 融合 ; 另 一 方面 ,信息 流转 过 程 中 包含 城市 系统 下 的 唯一 编码 ， 
并 通过 基础 属性 描述 与 物 联 实体 相关 联 , 有 利于 根据 不 同 的 业务 和 场景 需 
求 选择 合理 的 信息 流转 模式 ,并 根据 需求 的 变化 进行 自 适 应 调整 。 


423 智慧 城市 多 源 信 息 协同 的 标准 体系 总 体 框架 


目前 ,国内 外 在 智慧 城市 标准 体系 框架 和 共性 标准 方面 尚未 形成 统一 
的 认 知 。 一 般 认 为 ,智慧 城市 标准 体系 涉及 总 体 标准 .基础 设施 .建设 与 宜 
居 ,管理 与 服务 .产业 与 经 济 、 安 全 与 运 维 等 多 个 部 分 。 智 慧 城市 多 源 信息 
协同 标准 作为 智慧 城市 标准 体系 框架 的 主要 组 成 部 分 ,需要 包含 信息 技术 
标准 体系 和 城市 管理 标准 体系 两 个 范畴 的 必要 元 素 : 同 时 ,还 应 体现 智慧 城 
市 不 同 于 传统 城市 和 数字 城市 的 典型 特征 。 智 慧 城 市 多 源 信息 协同 标准 体 
系 的 总 体 框架 如 图 4. 3 所 示 。 

从 内 部 结构 上 看 ,智慧 城市 多 源 信息 协同 标准 体系 主要 由 五 个 子 体系 
组 成 : 

(1) 基础 信息 标准 体系 : 重点 在 于 物 联 实体 的 基础 信息 属性 、 编 码 及 其 
表示 方式 。 

(2) 信息 流转 标准 体系 : 重点 在 于 城市 系统 下 的 信息 共享 方式 、 信 息 流 
转 模式 及 其 共性 规范 。 

G) 领域 应 用 标准 体系 : 以 业务 属性 为 主 ,具体 内 容 由 行业 的 要 求 和 特 
点 决定 。 


智慧 城市 多 源 信息 协同 总 体 框架 
TT 协同 标准 与 协同 模式 的 对 接 


智慧 城市 多 源 信息 协同 标准 体系 
智慧 城市 领域 应 用 标准 体系 
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基础 术语 定义 
全 所 制定 标准 与 已 有 标准 的 对 接 T 


已 有 基础 标准 规范 和 管理 制度 


图 4.3 智慧 城市 多 源 信息 协同 标准 体系 的 总 体 框架 


(4) 安全 标准 体系 : 主要 包括 安全 防护 体系 的 基本 规范 ,重点 涉及 身份 
验证 ,访问 控制 ,传输 安全 等 技术 要 求 。 

(5) 接口 标准 体系 : 重点 在 于 信息 流转 过 程 中 数据 交换 接口 规范 ,及 智 
慧 城市 系统 中 与 识别 和 定位 相关 的 认证 授权 接口 规范 。 

从 内 部 关系 上 ,基础 信息 标准 、 信 息 流 转 标 准 和 领域 应 用 标准 在 逻辑 关 
系 上 自 下 而 上 ,下 层 标准 是 上 层 标 准 的 基础 ;安全 标准 和 接口 标准 属于 标准 
体系 的 共性 规范 ,与 其 他 所 有 标准 相关 联 。 

除 此 之 外 ,智慧 城市 多 源 信 息 协 同 标准 体系 需要 做 好 三 个 层面 的 外 部 
对 接 : 第 一 ,与 智慧 城市 多 源 信息 协同 总 体 框架 之 间 , 形 成 标准 体系 与 协同 
体系 对 接 ; 第 二 ,与 智慧 城市 标准 体系 中 的 其 他 标准 规范 之 间 , 形 成 信息 标 
准 与 城市 标准 的 对 接 ;第 三 .与 已 有 基础 标准 规范 和 管理 制度 之 间 , 形 成 规 
划 标 准 与 已 有 标准 的 对 接 。 

智慧 城市 多 源 信息 协同 标准 体系 建设 是 打通 领域 间 的 “智慧 孤岛 "、 实 
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现 城市 和 区 域 物 联 实体 "一盘棋 ”管理 的 必 经 之 路 ,也 是 标准 化 与 城市 化 、 信 
息 化 协同 发 展 蝇 待 解 决 的 核心 问题 。 通 过 对 智慧 城市 系统 中 的 各 类 实体 和 
多 源 信息 的 统筹 管理 ,能 够 为 智慧 城市 的 运行 监管 和 精细 化 服务 提供 更 快 
速 、 更 有 效 的 支撑 。 

智慧 城市 中 的 各 相关 部 门 和 各 领域 主体 应 在 信息 协同 标准 体系 总 体 杠 
架 基 础 上 ,分 别 制定 本 行业 、 本 领域 的 应 用 和 服务 标准 ,实现 技术 标准 与 服 
务 标准 、 信 息 标准 与 城市 标准 ,规划 标准 与 现行 标准 的 一 体 化 管理 ;同时 ,在 标 
准 体系 的 建设 过 程 中 充分 体现 信息 技术 和 城市 管理 两 个 范畴 的 核心 内 涵 , 做 
好 标准 体系 与 信息 协同 总 体 框架 的 无 颖 对 接 ,体现 智慧 城市 不 同 于 传统 城市 
和 数字 城市 的 典型 特征 ,逐步 建立 完善 的 智慧 城市 信息 协同 标准 体系 。 


43 智慧 城市 多 源 信息 协同 的 关键 基础 标 ， 


431 基础 信息 属性 、 编码 及 其 表示 方式 


基础 信息 标准 系列 主要 以 智慧 城市 管理 的 应 用 需求 为 依托 ,以 城市 系 
统 下 的 物 联 信息 流转 为 前 提 , 对 管理 对 象 .感知 设备 、 传 感 网 网 关 等 物 联 实 
体 的 基础 信息 特征 所 需要 的 属性 .编码 及 其 表示 方式 进行 规定 ,用 于 不 同 应 
用 领域 对 物 联 实体 基础 信息 的 统一 标识 和 统筹 管理 。 

1. 基础 信息 属性 

物 联 实体 的 基础 信息 可 以 按照 管理 要 求 分 为 核心 属性 和 扩展 属性 。 其 
中 ,核心 属性 属于 强制 管理 范畴 ,扩展 属性 主要 体现 业务 管理 特性 ,可 根据 
物 联 实体 的 个 性 特征 进行 扩展 。 

1) 管理 对 象 基 础 信息 

管理 对 象 基 础 信息 的 核心 属性 主要 包括 管理 对 象 名 称 、 管 理 对 象 编码 
(唯一 管理 标识 编码 ) ,管理 对 象 其 他 编码 (在 其 他 编码 体系 或 应 用 系统 中 存 
在 的 编码 ) ,管理 对 象 类 别 码 ( 所 属 分 类 ) .管理 对 象 所 属 业 务 .管理 对 象 空间 


位 置 (包括 位 置 描述 ,坐标 类 型 ,坐标 单位 , 横 、 纵 坐标 等 ) .管理 对 象 负责 方 
(包括 负责 部 门 、 重 点 监控 和 管控 的 内 容 等 ,如 危险 品 仓库 重点 关注 存储 环 
境 安全 、 温 湿度 等 信息 ) 。 

管理 对 象 基 础 信息 的 扩展 属性 主要 体现 管理 对 象 具体 的 业务 管理 特 
性 。 如 “烟花 爆竹 仓库 ”具有 “库房 间 数 、 仓 库 面积 、 灭 火器 数 、 消 防水 源 、 限 
制 存 箱 量 、 限 制 存 药 量 ”, “烟花 爆竹 批发 单位 "具有 “安全 管理 人 员 数 量 、 仓 
库 保 管 和 守护 人 员 数 量 、 运 输 车 辆 数量 ”",“ 消 防 车 辆 "具有 “车 辆 牌号 ”“ 自 
动 气象 站 ”具有 “建设 时 间 ” 等 特有 属性 。 

2) 感知 设备 基础 信息 

感知 设备 基础 信息 的 核心 属性 主要 包括 感知 设备 名 称 ( 如 温度 传 感 
器 ) .感知 设备 编码 (唯一 管理 标识 编码 ) .感知 设备 其 他 编码 (在 其 他 编码 体 
系 或 应 用 系统 中 存在 的 编码 ) .感知 设备 类 别 码 ( 所 属 分 类 ) .是 否 固定 (感知 
设备 工作 时 是 否 固定 安装 在 某 个 位 置 )、 感 知 管理 对 象 编码 (感知 设备 用 来 
感知 的 管理 对 象 的 编码 ,感知 设备 与 管理 对 象 的 关系 为 多 对 一 的 关系 )、 设 
备用 途 ( 感 知 设备 用 来 感知 的 内 容 描述 ) ,感知 频率 (感知 设备 采集 信息 的 最 
小 时 间 间 隔 )、 编 解码 标准 (感知 设备 在 传输 过 程 中 采用 的 信息 编 解 码 标准 ， 
包括 编 解码 标准 名 称 ( 如 SVAC 标准 )、 编 解码 标准 类 型 (如 SVAC 通用 标 
ME) 、 编 解码 方式 等 ) .感知 设备 空间 位 置 (包括 位 置 描述 ,坐标 类 型 ,坐标 单 
位 , 横 、 纵 坐标 ,高 度 等 )、 感 知 设备 所 属 业 务 、 感 知 设备 负责 方 、 感 知 设备 型 
号 ,感知 设备 安装 时 间 ,感知 设备 生产 时 间 ,感知 设备 生产 单位 等 。 

感知 设备 基础 信息 的 扩展 属性 主要 体现 的 感知 设备 个 性 特征 管理 属 
性 。 如 感知 设备 具有 的 参数 信息 ,如 安全 监管 部 门 的 温度 计 具 有 “所 属 仓 
库 、 所 属 库房 .所属 房间 、 型 号 ,最 小 刻度 、 最 大 刻度 ”, 环 保 部 门 的 空气 质量 
传感器 具有 “量程 .工作 温度 、 存 储 温度 、 加 热 阻抗 .加 热电 压 ” 等 特殊 属性 。 

3) 传 感 网 网 关 基 础 信息 

传 感 网 网 关 基 础 信息 属于 强制 管理 范畴 。 核 心 属性 主要 包括 传 感 网 网 
关 名 称 、 传 感 网 网 关 编 码 ( 唯 一 管理 标识 编码 ) .感知 设备 其 他 编码 (在 其 他 
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编码 体系 或 应 用 系统 中 存在 的 编码 ) 、 接 入 的 感知 设备 编码 、 传 感 网 网 关连 
接 的 CPE( 包 括 CPE 的 IP 地 址 、SIM 卡号 (主要 针对 采用 无 线 网 传输 的 
CPE) SE) 、 传 感 网 网 关 空 间 位 置 (包括 位 置 描述 ,坐标 类 型 ,坐标 单位 , 横 、 纵 
坐标 ,垂直 高 度 等 )、 传 感 网 网 关 所 属 业 务 、 传 感 网 网 关 负 责 方 、 传 感 网 网 关 
型 号 、 传 感 网 网 关 安 装 时 间 、 传 感 网 网 关 生 产 时 间 、 传 感 网 网 关 生 产 单位 等 。 

管理 对 象 .感知 设备 、 传 感 网 网 关 的 基础 信息 核心 属性 及 其 关联 关系 如 
图 4.4 所 示 。 


or 
核心 | 实体 名 称 | | 唯一 编码 | | 其 他 编码 | | 类 别 码 | | 所 属 业 务 | | 空间 位 置 | | 负责 方 
属性 i 下 下 下 iY 


管理 对 象 感知 设备 传 感 网 网 关 


图 4.4 物 联 实体 基础 信息 的 核心 属性 及 其 关联 关系 


感知 设备 基础 信息 的 核心 属性 中 ,通过 管理 对 象 编码 与 对 应 感知 的 管 
理 对 象 进行 关联 ,感知 设备 与 管理 对 象 的 关系 为 多 对 一 关系 ; 传 感 网 网 关 基 
础 信息 的 核心 属性 中 ,通过 感知 设备 编码 与 所 接 入 的 感知 设备 进行 关联 。 

2 物 联 实体 编码 结构 与 管理 

物 联 实 体 的 编码 规则 需要 体现 三 个 特点 : 一 是 唯一 性 , 即 实体 的 唯一 标 
识 ; 二 是 可 分 类 , 即 编码 具有 一 定 的 规则 ;三 是 能 够 反映 所 编码 的 承载 信息 ， 
即 数据 包含 有 意义 的 内 容 。 

为 了 编码 规范 的 通用 性 和 使 用 的 灵活 性 ,编码 结构 应 由 定 长 码 ( 前 段 
码 ) 和 非 定 长 码 ( 后 段 码 ) 两 组 编码 组 成 。 定 长 码 (前 段 码 ) 由 编码 管理 部 门 
统一 分 配 和 维护 ; 非 定 长 码 (后 段 码 ) 根 据 不 同 领域 和 行业 的 业务 特征 ,由 物 


联 实体 的 所 属 部 门 依据 现 有 标准 或 自行 编制 ,并 将 编码 规则 向 编码 管理 部 
门 提交 备案 。 

D 定 长 码 (前 段 码 ) 

定 长 码 ( 前 段 码 ) 规 定编 码 版 本 、 实 体 类 别 、 实 体 归属 部 门 等 基本 信息 ， 
由 编码 管理 部 门 统一 管理 。 其 中 ,版 本 码 2 个 字 节 ,由 编码 管理 部 门 负责 发 
布 编码 版 本 代号 ,根据 编码 中 相关 因素 变更 情况 进行 动态 调整 ,并 定期 统一 
更 新 ;类 别 码 1 个 字 节 ,“1” 代 表 管 理 对 象 ,“2” 代 表 感 知 设备 ;单位 编码 使 用 
物 联 实体 所 属 部 门 的 组 织 机 构 代 码 (或 根据 相关 部 门 的 统一 标准 规定 执 
行 ) ,由 编码 管理 部 门 负责 发 布 和 变更 ,变更 情况 在 版 本 码 中 体现 。 

2) 非 定 长 码 ( 后 段 码 ) 

感知 设备 的 后 段 码 编码 结构 采用 “感知 设备 出 厂 标准 编码 十 [顺序 码 ] 
十 校 验 码 ?的 形式 。 其 中 ,感知 设备 出 三 标 准 编码 也 可 以 采用 现 有 国家 或 行 
业 或 地 方 标准 编码 或 自 定义 码 。 如 果 可 以 保证 唯一 性 , 则 顺序 码 可 省 略 。 

管理 对 象 的 后 段 码 编码 结构 采用 “ 现 有 标准 分 类 编码 十 [顺序 码 ] 十 校 
验 码 ” 的 形式 。 兼 容 现 有 标准 分 类 编码 可 以 由 多 个 标准 编码 组 合 , 如 可 以 由 
市 政 设 施 部 件 编码 十 位 置 编码 十 行政 区 划 编 码 , 也 可 以 仅 采用 单一 的 标准 
编码 。 如 果 现 有 标准 分 类 编码 能 够 保证 唯一 性 , 则 顺序 码 可 省 略 。 

3) 码 段 补 位 

编码 时 ,如 采用 十 进 制 编码 方式 ,长度 一 般 不 超过 90 位 ;如 采用 十 六 进 
制 编码 方式 ,长 度 一 般 不 超过 0xF6( 即 十 进 制 数 246) 位 。 当 编码 长 度 小 于 
最 大 长 度 时 ,不 足 位 补 零 。 如 采用 自 定义 码 , 且 自 定义 码 为 顺序 码 时 , 待 编 
码 的 管理 对 象 或 感知 设备 数量 为 2000 个 ,编码 起 始 号 为 1, 结束 号 为 2000。 
由 于 编码 总 长 度 不 得 小 于 24 位 , 减 去 前 段 码 长 度 12 位 后 ,后 段 码 长 度 为 12 
位 , 则 后 段 码 编码 为 000000000001 至 000000002000. 

非 定 长 码 ( 后 段 码 ) 发 生变 更 或 部 门 内 部 编码 规则 发 生变 更 时 ,应 向 编 
码 管理 部 门 提交 申请 并 同步 更 新 。 此 外 ,编码 应 保证 整体 结构 的 完整 性 , 即 
定 长 码 和 非 定 长 码 在 编制 和 使 用 时 不 得 拆 分 。 
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432 物 联 信息 的 接 入 与 交换 接口 


1. 物 联 信息 接 入 

信息 流转 标准 主要 规范 智慧 城市 中 可 共享 信息 的 基本 描述 ` 流 转 模式 
与 技术 要 求 ,实现 信息 在 城市 系统 下 共享 和 接 人 的 统筹 管理 ,并 对 信息 在 流 
转 过 程 中 的 整合 融合 标准 提供 共性 支撑 。 

从 城市 系统 下 的 信息 流向 来 看 ,信息 的 流转 路 径 主要 包括 信息 接 人 和 
信息 协同 两 种 情况 ( 见 图 4. 5) 。 信 息 接 人 模式 主要 是 信息 的 单 向 流转 ,包括 
直接 流转 、 接 人 转发 和 服务 接 人 三 种 情况 ;信息 协同 模式 则 主要 以 前 置 交换 
的 形式 开展 跨 部 门 、 跨 层级 的 信息 联动 。 


yO 1 
信息 提供 方 = Sia 信息 需求 方 
| ;监控 | 
言 息 协同 1 信息 协同 
加 信息 协同 es | 加 信息 协同 | 
前 置 机 H | Ta | 前 置 机 
| | |! | 存储 转发 二 
1 onnee ERER Tormine! i 
cc a A ee ee 人 | 
1 1 1 
1 Portlet OWA | 1 
应 用 系统 tte 站 一 | 应 用 系统 
i Web 服 务 eae T 
1 
| onaee| | omg, __ | if z 
数据 库 ore, 上 -| 数据库 
loonie | f@peagee | onal 


信息 源 (感知 终端 ) 


图 4.5 城市 系统 下 的 信息 流转 路 径 


1) 信息 接 人 模式 

(1) 直接 流转 方式 : 包括 直接 接 人 和 数据 库 对 接 两 种 方式 。 

直接 接 入 指 信息 从 信息 源 直 接 接 入 需求 方 的 数据 库 , 主 要 对 数据 库 类 
型 数据 结构 等 基本 信息 描述 和 技术 要 求 进行 规范 。 


数据 库 对 接 指 直接 (或 通过 统一 的 中 心平 台数 据 库 ) 访 问 信息 提供 方 的 
数据 库 获 取信 息 ,主要 对 数据 库 类 型 .用户 名 .连接 方式 (如 JDBC 或 ODBC) 
等 基本 信息 描述 和 技术 要 求 进行 规范 。 

(2) 接 入 转发 方式 : 实时 感知 信息 统一 接 入 中 心平 台 后 ,根据 实际 业务 
需要 和 约定 规则 直接 分 发 至 一 个 或 多 个 信息 需求 方 ,主要 对 数据 类 型 .数据 
需求 方 等 基本 信息 描述 和 技术 要 求 进行 规范 。 

(3) 服务 接 人 方式 : 包括 系统 对 接 、Portlet HEA . 1 HELE A Web 服务 
接 入 四 种 方式 。 

系统 对 接 指 采用 单 点 登录 的 方式 ,直接 (或 通过 统一 的 中 心平 台 ) 访 问 
其 他 授权 的 应 用 系统 ,主要 对 系统 名 称 、 系 统 结构 (如 B/S 结构 )、 单 点 登录 
地 址 数据 同步 地 址 、 同 步 数 据 类 型 、 系 统 改 造 ( 接 口 要 求 ) 等 基本 信息 描述 
和 技术 要 求 进行 规范 。 

Portlet i A 48 (i HE HED HE HE Portlet. 直接 ( 或 通过 统一 的 中 心平 台 ) 
垦 入 信息 需求 方 的 应 用 系统 ,主要 对 页 面 名 称 \ 链 接地 址 、 编 码 要 求 (如 URL 
编码 ) .通信 协议 (如 HTTP 协议 和 HTTPS 协议 )、 代 码 规 范 ( 如 符合 
HTML4. 0 规范 或 XHTML1. 0 规范 ) 等 基本 信息 描述 和 技术 要 求 进行 
规范 。 

页 面 链接 指 信息 需求 方 直接 (或 通过 统一 的 中 心平 台 ) 链 接 信息 提供 方 
的 页 面 地 址 ,主要 对 页 面 名 称 、 宽 度 、 高 度 、 地 址 、 登 录 验 证 ,技术 规范 (如 符 
合 JSR-168 规范 ) 等 基本 信息 描述 和 技术 要 求 进行 规范 。 

Web 服务 接 入 指 信息 需求 方 直接 (或 通过 统一 的 中 心平 台 ) 调 用 信息 提 
供 方 发 布 Web 服务 ,主要 对 Web 服务 名 称 、 地 址 、 类 别 、 方 法 、 有 效 期 .服务 
协议 要 求 (服务 发 现 协 议 、 服 务 传输 协议 .服务 消息 协议 ) 等 基本 信息 描述 和 
技术 要 求 进行 规范 。 

2) 信息 协同 模式 

按照 约定 的 交换 规则 ,信息 需求 方 通过 前 置 机 的 方式 获取 信息 提供 方 
的 信息 ,主要 对 数据 类 型 .交换 频率 、 转 换 规 则 等 基本 信息 描述 和 技术 要 求 
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进行 规范 。 

信息 流转 标准 体系 一 方面 需要 对 不 同 信息 共享 和 接 人 方式 的 基本 信息 
描述 和 技术 要 求 进行 规范 , 另 一 方面 需要 对 数据 传输 格式 等 共性 的 技术 标 
准 进行 统一 。 

2 物 联 信息 协同 接口 

物 联 信息 协同 的 接口 主要 包括 数据 库 协同 接口 和 文件 协同 接口 两 种 方 
式 。 每 种 方式 提供 JMS(Java Message Service, Java 消息 服务 ) 和 Web 服务 
两 种 接口 ,并 支持 跨 语 言 . 跨 操作 系统 调用 。 

1) 数据 库 协同 接口 

数据 库 协 同根 据 数据 库 数据 交换 请 求 , 将 特定 的 数据 库 数 据 交 换 到 指 
定 的 其 他 信息 协同 节点 ,支持 各 种 主流 关系 型 数据 库 ( 包 括 Oracle, SQL 
Server, DB2, Access, MySQL 等 ) 之 间 的 数据 协同 。 

(1) 数据 库 协同 请 求 接口 : 将 数据 库 协同 请 求 信息 发 送 到 管理 中 心 ,并 
在 发 送 数 据 的 信息 协同 节点 与 接收 数据 的 信息 协同 节点 之 间 建 立会 话 。 数 
据 库 协同 请 求 接口 参数 说 明 见 表 4. 1( 数 据 库 协同 请 求 对 象 DBExRequest 
的 XML Schema 定义 见 附录 C) 。 

表 4.1 数据 库 协同 请 求 接口 参数 说 明 


参数 名 称 参数 类 型 可 选 / 必 选 参数 含义 


数据 库 协 同 请 求 对 


象 DBExRequest 必 选 数据 库 协 同 请 求 信息 


Message 


采用 的 传送 模式 ,支持 的 传送 模式 
至 少 应 包括 持续 传送 模式 


Mee Mod Int us PERSISTENT 和 一 次 性 传送 模式 
NON_PERSISTENT 
请 求 的 优先 级 .共有 10 个 优先 级 。 

Priority Int 可 选 0 是 最 低 优先 级 ,9 是 最 高 优先 级 。 
默认 的 优先 级 是 4 

timeToLive | Int 可 选 请 求 的 存在 时 间 ,单位 为 毫秒 ,由 


发 送 方 指定 ,0 为 无 限制 


(2) 数据 库 数据 发 送 /接收 接口 : 将 需 交 换 的 数据 库 数 据 发 送 给 接收 数 
据 的 信息 协同 节点 。 数 据 库 数 据 发 送 /接收 接口 参数 说 明 见 表 4. 2( 数 据 库 
协同 数据 对 象 DBExData 的 XML Schema 定义 见 附录 C). 

2) 文件 协同 接口 

文件 协同 根据 文件 数据 协同 请 求 .将 特定 的 文件 数据 交换 到 指定 的 其 
他 信息 协同 节点 ,支持 文本 ,二进制 文件 等 不 同文 件数 据 的 协同 。 


表 4.2 数据 库 数据 发 送 / 接 收 接口 参数 表 


参数 名 称 参数 类 型 可 选 / 必 选 参数 含义 
dbData 数据 库 协 同 数 据 对 必 选 需要 通过 数据 库 数 据 发 送 / 接 
象 DBExData 收 接口 发 送 / 接 收 的 数据 集 


(1) 文件 协同 请 求 接口 : 将 文件 协同 请 求 信息 发 送 到 管理 中 心 ,并 在 发 
送 数据 的 信息 协同 节点 与 接收 数据 的 信息 协同 节点 之 间 建 立会 话 。 文 件 协 
同 请 求 接口 参数 说 明 见 表 4. 3( 文 件 协同 请 求 对 象 FileExRequest 的 XML 
Schema 定义 见 附录 C) 。 


表 4.3 文件 协同 请 求 接口 参数 表 


参数 名 称 参数 类 型 可 选 / 必 选 参数 含义 


文件 交换 请 求 对 
象 FileExRequest 


Message 必 选 文件 协同 请 求 信息 


采用 的 传送 模式 ,支持 的 传送 模式 
至 少 应 包括 持续 传送 模式 


| 可 选 | PERSISTENT 和 一 次 性 传送 模式 
NON_PERSISTENT 
请 求 的 优先 级 ,共有 10 个 优先 级 。 

Priority Int 可 选 0 是 最 低 优先 级 ,9 是 最 高 优先 级 。 
默认 的 优先 级 是 4 

timeToLive jt 可 先 请 求 的 存在 时 间 , 单 位 为 毫秒 ,由 


发 送 方 指定 ,0 为 无 限制 


(2) 文件 数据 发 送 /接收 接口 : 将 需 协 同 的 文件 数据 发 送 给 接收 数据 的 
信息 协同 节点 。 文 件数 据 发 送 /接收 接口 参数 说 明 见 表 4. 4( 文 件 协同 数据 
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对 象 FileExData AY XML Schema 定义 见 附录 C). 


表 4.4 文件 数据 发 送 /接收 接口 参数 表 


参数 名 称 参数 类 型 可 选 / 必 选 参数 含义 
文件 协同 数据 对 必 选 需要 通过 文件 数据 发 送 / 接 收 
RI & FileExData = 接口 发 送 /接收 的 数据 集 


433 物 联 信息 传输 


物 联 信息 的 传输 从 底层 逐 级 向 上 分 为 传 感 网 网 关 、 支 撑 层 和 应 用 系统 
层 三 个 层次 。 信 息 传输 通信 协议 对 应 于 ISO/OSI 定义 的 7 层 协议 中 的 应 用 
层 , 在 基于 不 同 传输 网 络 的 传输 层次 之 间 提 供 交 互通 信 。 

物 联 信息 的 传输 网 络 连接 相对 复杂 ,其 基础 传输 层 依据 不 同 的 传输 网 
络 分 为 基于 TCP/IP 协议 的 传输 和 基于 非 TCP/IP 协议 的 传输 两 类 实现 方 
式 。 传 感 网 网 关 和 支撑 平台 之 间 采 用 基于 TCP/IP 协议 的 数据 传输 和 基于 
AE TCP/IP 协议 短 消 息 数据 通信 两 种 方式 ;支撑 平台 与 应 用 系统 之 间 采 用 基 
于 TCP/IP 协议 的 数据 传输 方式 。 应 用 层 依赖 于 所 选用 的 传输 网 络 ,在 选 定 
的 传输 网 络 上 进行 应 用 层 的 数据 通信 ,在 基础 传输 层 已 经 建立 的 基础 上 , 整 
个 应 用 层 的 协议 和 具体 的 传输 网 络 无 关 。 

1. 基于 TCPIP 协议 的 传输 

在 存在 有 线 或 无 线 网 络 连接 、 能 够 进行 基于 TCP/IP 协议 的 数据 传输 情 
况 下 ,可 以 采用 此 类 数据 传输 方式 进行 数据 交换 。 此 方式 的 使 用 建立 在 
TCP/IP 基础 之 上 ,常用 的 有 通用 无 线 分 组 业务 (General Packet Radio 
Service, GPRS) 、. 非 对 称 数 字 用 户 环 路 (Asymmetrical Digital Subscriber 
Loop. ADSL) 、 码 分 多 址 (Code Division Multiple Access,CDMA) 等 。 

1) 应 答 模式 

完整 的 命令 由 请 求 方 发 起 ,响应 方 应 答 组 成 。 具 体 步骤 包括 : 请 求 方 发 
送 请 求 命 令 给 响应 方 ; 响 应 方 接 到 请 求 命令 后 应 答 ,请 求 方 收 到 应 答 后 认为 


连接 建立 ;请 求 方 发 送 请 求 的 操作 ;响应 方 执 行 请 求 的 操作 ;响应 方 通知 请 
求 方 请 求 执行 完毕 ,没有 应 答 按 超时 处 理 : 重 复 上 述 步骤 ,直到 请 求 和 响应 
的 其 中 一 方 发 送 结束 命令 或 超过 一 个 适应 性 时 长 未 收 到 对 方 数据 ;命令 
完成 。 

在 基于 TCP/IP 协议 的 数据 传输 方式 下 ,交互 双方 可 以 进行 双向 通信 ， 
网 络 层 应 兼容 TCP 和 UDP 两 种 传输 协议 。 

2) 超时 重 发 机 制 

对 应 的 超时 主要 包括 以 下 四 种 情况 : 一 个 请 求 命令 发 出 后 在 规定 的 时 
间 内 未 收 到 回应 , 则 认为 属于 请 求 回 应 超时 。 超 时 后 重 发 , 重 发 规定 次 数 后 
仍 未 收 到 回应 认为 通信 不 可 用 ,通信 结束 。 超 时 时 间 和 超时 重 发 次 数 可 以 
根据 具体 的 通信 方式 和 任务 性 质 自 定义 。 

请 求 方 在 收 到 请 求 回应 (或 一 个 分 包 ) 后 规定 时 间 内 未 收 到 返回 数据 或 
命令 执行 结果 , 则 认为 属于 执行 超时 ,命令 执行 失败 ,结束 。 

3) 交互 过 程 

信息 的 交互 过 程 是 指 建 立 在 应 用 层 上 的 应 用 信息 交互 过 程 。 在 交互 过 
程 中 ,任意 一 方 发 送 结束 命令 时 ,交互 过 程 结束 。 

交互 过 程 一 般 分 为 三 个 主要 阶段 : 一 是 建立 会 话 阶段 ,由 发 送 方 发 起 请 
求 会 话 ,接收 方 分 配 会 话 ID 并 确认 会 话 ; 建 立会 话 阶段 涉及 的 报 文 格式 有 
请 求 会 话 和 确认 会 话 ; 二 是 提交 数据 阶段 ,由 发 送 方向 接收 方 提交 数据 , 接 
收 方 接收 到 数据 后 确认 数据 ;提交 数据 阶段 涉及 的 报 文 格式 种 类 较 多 ,包括 
确认 数据 所 有 格式 ;三 是 注销 会 话 阶段 ,由 发 送 方向 接收 方 发 送 注销 会 话 信 
息 ,接收 方 将 此 会 话 ID 注销 ;注销 会 话 阶段 涉及 的 报 文 格式 为 注销 会 话 。 

4) 数据 结构 

通信 和 包 采 用 二 进 制 编码 格式 ,未 特别 说 明 的 均 采 用 小 端 法 机 器 存放 数 
据 方式 ,兼容 基于 TCP 和 UDP 两 种 协议 的 数据 传输 。 通 信 协 议 数据 结构 
如 图 4. 6 所 示 ,适用 于 RS-232、RS-485 及 RS-422 等 串口 通信 。 

通信 和 包 是 最 小 通信 单元 。 在 一 次 会 话 过 程 中 ,可 以 产生 一 次 或 多 次 传 
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和 z 通信 包 组 成 _ 
i 包头 || 数据 段 长 度 | 数据 自 校 验 和 
i sat Rey 
数据 自 信息 || 会 话 || some |] 应 答 
市 类 型 || 版 本 号 || 标识 | ID || 序号 || 序号 
7 E BREE = 
$ 图 4.6 通信 协议 数据 结构 
5 
a 输 过 程 , 即 可 以 发 送 和 接收 多 个 通信 和 包 , 但 每 次 传输 仅 传输 一 个 通信 和 包 。 通 
5 。 “ 信 和 包 结 构 组 成 如 表 4. 5 所 示 。 
i 
表 4.5 BERA HAR 
名 称 类 型 长 度 描述 
包头 字符 SH 固定 为 0x7E, 每 一 个 通信 包 的 开 
始 字符 
数据 段 长 度 | 十 进 制 整数 2 字 节 数据 段 的 数据 长 度 
数据 段 数据 0<N<4096 | 长 度 不 固定 , 转 义 后 的 实际 数据 
re 二 数据 段 的 校 验 结果 ,如 果 不 为 
校 验 和 上 六 进 制 整 数 | 1 字 节 DREF (alee 


数据 段 部 分 为 转 义 后 的 实际 数据 ,在 发 送 或 接收 数据 时 ,为 了 避免 数据 
中 出 现 的 字 节 与 数据 帧 的 标志 性 字符 发 生 冲 突 , 必 须 转 义 冲突 数据 值 。 数 
HE 0x7E 和 0x7D 替换 为 两 个 字 节 : 第 一 个 字 节 是 0x7D, 第 二 个 字 节 是 数据 
与 0x20 异 或 后 的 值 。 数 据 段 经 转 义 后 得 到 的 实际 数据 结构 如 表 4.6 所 示 。 


表 4.6 数据 段 转 义 后 的 数据 结构 


名 称 类 型 长 度 描 g 


固定 为 0x0102 ,标示 数据 段 所 属 类 
型 ,如 物 联 数据 


固定 为 0x02, 物 联 信息 传输 规范 的 
生命 期 版 本 标示 符 . 从 0x0001 版 开 
始 .每 推进 一 个 版 本 ,数值 增加 1, 当 
前 版 本 为 02 版 


数据 段 类 型 | 十 六 进 制 整数 | 2 字 节 


版 本 号 十 六 进 制 整数 | 1 字 节 
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续 表 
名 称 类 型 长 度 描 g 


用 于 标识 信息 的 类 别 ,包括 参数 命 


Re: TAERE ere 令 . 交 互 命令 .数据 命令 和 控制 命令 


会 话 双方 在 一 个 会 话 过 程 中 始终 保 


At 本 字 
会 话 ID 十 进 制 整数 。 | 4 字 节 a eek 
以 日 时 间作 为 通信 包 序号 ,日 时 间 为 
数据 段 序号 | 十 进 制 整数 。 | 4 字 节 从 当天 午夜 0 时 起 到 当前 时 间 的 毫 
秒 数 ,每 毫秒 不 超过 1 个 通信 包 
应 答 序号 | 十 进 制 整数 。 | 4 字 节 响应 方 所 响应 的 数据 段 序号 
包括 参数 命令 、 交 互 命令 ,数据 命令 
cna: las 0 二 N4080 | 和 控制 命令 的 信息 内 容 ,本 字段 格式 


为 可 扩展 格式 ,可 通过 其 他 补充 规范 
对 本 字段 格式 进行 补充 定义 


信息 通信 需要 对 涉及 的 交互 命令 信息 内 容 进 行 数据 结构 的 统一 约束 。 
交互 命令 是 包括 建立 会 话 . 断 开 会 话 及 交互 响应 使 用 的 一 类 信息 ,使 用 0x00 
到 0x3F 段 的 数据 单元 类 型 。 

2 基于 非 TCPIP 协议 的 传输 

在 不 存在 能 够 进行 基于 TCP/IP 协议 的 信息 传输 ,但 能 进行 短 消 息 或 其 
他 文本 方式 交互 的 情况 下 ,可 以 采用 基于 非 TCP/IP 协议 短 消 息 数据 通信 的 
方式 进行 信息 交换 。 此 类 方式 的 使 用 建立 在 相关 通信 链 路 上 ,常用 的 有 公 
共 电话 交换 网 (Public Switched Telephone Network, PSTN) 、 短 消息 数据 通 
信 等 。 

1) 通信 模式 及 传输 协议 

在 短 消 息 数据 通信 方式 下 , 按 交互 双方 系统 约定 及 短信 网 络 架 构 ,信息 
从 传 感 网 网 关 接 人 后 ,通过 相应 的 短信 或 文本 网 关 以 短信 形式 进行 单方 向 
传输 。 

2) 数据 结构 

短 消息 数据 通信 方式 的 物 联 数据 报 文 数据 结 构 使 用 格式 化 的 文本 短 
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信 。 短 消息 数据 通信 格式 的 物 联 数据 分 为 两 种 类 型 ,参数 命令 和 数据 命令 。 
每 种 类 型 的 信息 由 多 个 数据 项 组 成 ,数据 项 之 间 以 “, ”分隔 。 短 消息 数据 结 
HUR 4.7 所 示 。 


表 4.7 短 消息 数据 结构 


名 称 类 型 长 度 描 OR 


数据 段 类 型 字符 6 字 节 | 固定 为 *#GZJR#” 


固定 为 “2”, 物 联 信息 传输 规范 的 生命 期 版 本 标 
版 本 号 字符 | 可 变 长 | 示 符 , 从 “1” 版 开始 ,每 推进 一 个 版 本 ,数值 增加 
1, 当 前 版 本 为 *2” 版 


信息 标识 字符 | 可 变 长 | 用 于 标识 信息 的 类 别 , 包 括 参 数 命 令 和 数据 命令 


包括 参数 命令 和 数据 命令 的 信息 内 容 , 本 字段 格 
信息 内 容 字符 | 可 变 长 | 式 为 可 扩展 格式 ,可 通过 其 他 补充 规范 对 本 字段 
格式 进行 补充 定义 


3 数据 传输 的 循环 兄 余 校 验 


循环 元 余 校 验 (Cyclic Redundancy Check,CRC) 是 一 种 数据 传输 错误 检 
查 方法 。CRC 码 两 个 字 节 ,包含 16 位 的 二 进 制 值 。 它 由 传输 设备 计算 后 加 
入 到 数据 包 中 。 接 收 设备 重新 计算 收 到 消息 的 CRC ,并 与 接收 到 的 CRC 域 
中 的 值 比较 ,如 果 两 值 不 同 , 则 有 误 。 

具体 算法 如 下 : CRC 先 调和 人 一 个 值 是 全 *1” 的 16 位 寄存 器 ,然后 调用 
一 个 过 程 将 消息 中 连续 的 8 位 字 节 各 当前 寄存 器 中 的 值 进行 处 理 。 仅 每 个 
字符 中 的 8 位 数据 对 CRC 有 效 ,起 始 位 和 停止 位 以 及 奇偶 校 验 位 均 无 效 。 

CRC 校 验 字 节 的 生成 步骤 如 下 : 

C1) 安装 一 个 16 位 寄存 器 ,所 有 数位 均 为 1 。 

(2) 取 被 校 验 串 的 一 个 字 节 与 16 位 寄存 器 的 高 位 字 节 进行 “ 异 或 "> 运 
算 ,运算 结果 放 和 人 这 个 16 位 寄存 器 。 

(3) 将 这 个 16 位 寄存 器 向 右 移 一 位 。 

(4) 车 向 右 ( 标 记 位 ) 移 出 的 数位 是 1, 则 生成 多 项 式 1010 0000 0000 
0001 和 这 个 寄存 器 进行 “ 异 或 ”运算 ;车 向 右 移出 的 数位 是 0, 则 返回 3。 


(5) 重复 (3) 和 (4) ,直至 移出 8 位 。 

(6) 取 被 校 验 串 的 下 一 个 字 节 。 

(7) 重复 (3) 一 (6) ,直至 被 校 验 串 的 所 有 字 节 均 与 16 位 寄存 器 进行 “ 异 
或 "运算 ,并 移 位 8 次 。 

这 个 16 位 寄存 器 的 内 容 即 2 字 节 CRC 错误 校 验 码 。 校 验 码 按照 先 高 
字 节 后 低 字 节 的 顺序 存放 。 


应 用 案例 2 城市 实体 的 基础 信息 与 编码 管理 


1. 基础 信息 属性 

以 某 智慧 城市 的 危险 品 监管 为 例 ,涉及 运输 、 存 储 、 销 售 等 危险 化 学 品 
流向 的 实时 跟踪 管理 ,综合 保障 、 环 境 整治 等 多 个 环节 ,需要 多 领域 .多 部 
门 、 多 层级 、 多 主体 的 协同 联动 。 

危险 品 监管 领域 的 管理 对 象 和 感知 设备 的 共性 核心 属性 包括 : 名 称 、 编 
码 、 所 属 业 务 、 空 间 位 置 、 负 责 方 、 频 率 、 编 /解码 标准 等 。 

管理 对 象 和 感知 设备 之 间 通 过 唯一 的 实体 编码 进行 关联 ,如 感知 设备 
“GPS 全 球 定位 系统 ”的 基础 属性 中 包含 “管理 对 象 编码 ”, 与 所 感知 的 管理 
对 象 “ 货 车 "的 唯一 编码 相对 应 。 

根据 不 同 的 业务 特定 , 物 联 实体 还 具备 一 系列 扩展 属性 。 

(1) 管理 对 象 的 基础 信息 : 如 “仓库 ”具有 “库房 间 数 、 仓 库 面 积 、 灭 火器 
数 、 消 防水 源 、 限 制 存 箱 量 、 限 制 存 药 量 " 等 扩展 属性 ,“ 批 发 单位 "具有 “安全 
管理 人 员 数 量 、 仓 库 保管 和 守护 人 员 数 量 、 运 输 车 辆 数量 ”等 扩展 属性 ,“ 消 
防 车 "具有 “车 辆 牌号 ”的 扩展 属性 ,“ 自 动 气象 站 ”具有 “建设 时 间 ” 等 扩展 
属性 。 

(2) 感知 设备 的 基础 信息 : 如 “温度 计 ” 具 有 “所 属 仓库 、 所 属 库房 、 所 属 
房间 、 型 号 、 最 小 刻度 、 最 大 刻度 ”等 扩展 属性 , “空气 质量 传感器 "具有 “ 量 
程 、 工 作 温 度 、 存 储 温度 、 加 热 阻抗 .加 热电 压 ” 等 扩展 属性 。 
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2 物 联 实体 编码 与 管理 

管理 对 象 和 感知 设备 编码 整体 结构 采用 前 段 码 与 后 段 码 组 合 的 形式 ， 
前 段 码 与 后 段 码 用 ”. 分隔; 传 感 网 网 关 编 码 统一 进行 自动 赋 码 。 前 段 码 为 
定 长 码 ,由 版 本 码 2 位 (编码 管理 部 门 发 布 ) .类 别 码 1 位 (管理 对 象 . 感 知 设 
备 、 传 感 网 网 关 ) .单位 编码 X 位 (如 组 织 机 构 代 码 ) 组 成 ,由 编码 管理 部 门 统 
一 管理 ;后 段 码 为 非 定 长 码 ,由 业务 部 门 依据 业务 规则 或 现行 标准 自行 编制 
和 管理 。 

智慧 城市 的 各 相关 部 门将 管理 对 象 , 感 知 设备 和 传 感 网 网 关 的 编码 及 
其 他 基础 信息 在 统一 的 平台 上 进行 注册 登记 。 如 管理 对 象 .感知 设备 和 传 
感 网 网 关 基 础 属性 发 生变 更 时 ,各 部 门 在 统一 的 平台 上 进行 变更 登记 。 注 
册 后 的 管理 对 象 .感知 设备 和 传 感 网 网 关 基础 信息 通过 统一 的 平台 为 权限 
内 的 用 户 提供 查询 服务 。 

3 管理 对 象 编码 (采用 十 进 制 ) 

以 某 智慧 城市 的 交通 管理 车 为 例 ,管理 对 象 的 编码 结构 如 下 : 

(1) 前 段 码 结构 : 包括 版 本 码 、 类 别 码 和 单位 编码 三 个 部 分 。 根 据 前 段 
码 管理 部 门 发 布 的 版 本 信息 ,当前 管理 对 象 编码 版 本 为 “01”; 管 理 对 象 的 类 
别 码 为 ”1”; 车 辆 的 管理 单位 为 交通 部 门 , 组 织 机 构 代 码 为 *110018”。 因 此 ， 
交通 管理 车 的 前 段 码 为 "011110018”。 

(2) 后 段 码 结构 : 按照 有 关 规 定 , 机 动车 分 类 编码 应 按照 GB 918. 1 一 
1989 规定 编制 ,但 该 标准 仅 规定 了 类 型 代码 ,不 能 保证 单个 机 动车 代码 的 唯 
一 性 ,顺序 码 不 可 省 略 , 故 后 段 码 编码 结构 为 “ 现 有 标准 分 类 编码 十 顺序 码 
十 校 验 码 ”的 形式 。 按 照 GB 918. 1 一 1989 机 动车 分 类 编码 为 3 位 10 进 制 
数字 编码 ,交通 管理 车 大 类 为 机 动车 ,大 类 编码 为 1; 中 类 为 特种 车 ,中 类 编 
码 为 5; 小 类 为 交通 管理 车 ,小 类 编码 为 5, 因 此 交通 管理 车 的 标准 分 类 编码 
为 “155”。 假 设 该 市 交通 管理 车 不 超过 10 万 辆 ,编码 主管 部 门 发 给 交通 管理 
车 1 一 10 万 的 顺序 码 , 即 交通 管理 车 占用 的 顺序 码 应 不 少 于 5 个 码 位 。 


结合 前 段 码 和 后 段 码 ,该 市 交通 管理 车 的 编码 为 : 011110018. 
155000001~011110018, 155100000, 

4. 感知 设备 编码 (采用 十 进 制 ) 

以 某 智慧 城市 公安 部 门 的 交通 视频 探头 为 例 ,感知 设备 的 编码 结构 
如 下 : 

(1) 前 段 码 结构 : 包括 版 本 码 、 类 别 码 和 单位 编码 三 个 部 分 。 根 据 前 段 
码 管理 部 门 发 布 的 版 本 信息 ,当前 感知 设备 编码 版 本 号 为 “01”; 感 知 设备 的 
类 型 码 为 *2”; 视 频 探 头 的 管理 单位 为 公安 交通 管理 部 门 , 组 织 结构 代码 为 
“110067”。 因 此 ,交通 视频 探头 的 前 段 码 为 "021110067”。 

(2) 后 段 码 结构 : 因 交 通 视频 探头 的 出 厂 标 准 编码 已 经 为 唯一 值 , 故 省 
略 顺序 码 ,后 段 码 编码 结构 为 “感知 设备 出 三 标准 编码 十 校 验 码 ”的 形式 。 
交通 视频 探头 的 出 厂 标准 编码 共 14 位 ,形式 为 “XXXXXXXXXXXXXX”。 

结合 前 段 码 和 后 段 码 ,交通 视频 探头 的 编码 为 : 012110067. 
XXXXXXXXXXXXXX。 

目前 ,大 部 分 已 颁布 执行 的 代码 和 编码 标准 针对 专业 ,行业 应 用 范畴 ， 
因此 嵌入 后 段 码 时 ,可 以 根据 管理 需要 参照 选用 标准 的 编码 规则 , 仅 截取 部 
分 有 效 的 码 段 和 编码 。 


应 用 案例 3 智慧 城市 危险 品 监管 的 实时 信息 接 入 


以 某 智慧 城市 的 危险 品 监管 为 例 , 物 联 实时 信息 涉及 安全 监管 .环境 保 
护 气象 消防. 卫生、 市 政 管理 ,城管 执法 、 民 防 、 交 通 、 公 安 等 多 个 领域 和 部 
门 , 各 信息 源 的 实时 信息 、 流 转 模式 .获取 频率 及 对 应 的 感知 设备 如 表 4. 8 
所 示 。 

根据 实际 管理 需求 ,视频 信息 主要 采用 直接 接 人 和 系统 对 接 两 种 模式 ， 
车 辆 位 置信 息 主要 采用 接 人 转发 模式 ,实时 监控 信息 主要 采用 前 置 交 换 模 
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sk ,预警 预报 信息 主要 采用 Portlet 做 入 模式 。 所 有 物 联 信息 均 按照 统一 的 
接口 标准 和 技术 规范 在 信息 源 、 信 息 提 供 方 . 基 础 支撑 平台 (中 心 管理 端 )、 
信息 需求 方 之 间 有 序 流转 。 通 过 信息 流转 标准 的 约束 ,可 以 实现 城市 管理 
不 同 领域 的 信息 协同 ,有 效 支撑 领域 精细 化 管理 和 科学 决策 。 


表 4.8 危险 品 监管 领域 的 物 联 实时 信息 接 入 


HSU BES e+ SSS tS— AS ose 


信息 来 源 实时 信息 流转 模式 | 获取 频率 | 感知 设备 
危险 品 运输 车 出 入 库 信息 | 前 置 交换 5 分 钟 RFID 
温度 传感器 、 湿 
eng E ES mee 5 分 钟 “| 度 传感器 .红外 
安全 监管 部 门 | 度 ` 越 界 等 ? 探测 器 等 
仓库 实时 状况 信息 直接 接 入 | 实时 “| 标清 摄像 头 
销售 实时 状况 信息 直接 接 入 ”| 实时 ”| 标清 摄像 头 
噪声 信息 EZM | 5 秒 钟 “| 噪声 传感器 
环保 部 门 ae 
大 气 成 分 含量 信息 前 置 交换 。 | 1 小 时 


mr 风速 传感器 、 风 
村 气象 信 fay ff HE 
实时 气象 信息 (风速 、 风 前 置 交 换 2 分 名 向 传感器 、 气压 


气象 部 门 向 ,气压 .雨量 等 ) 传感器 、 降 水 传 
感 器 等 
气象 预报 信息 Portlet 嵌入 | 1 小 时 | 一 
消防 车 位 置 及 运动 轨迹 Ep 北斗 卫星 导航 
消防 部 门 信息 接 人 转发 5 秒 钟 系统 
F 救护 车 (120、999) 位 置 及 5 Di GPS 全 球 定 位 
卫生 部 门 运动 轨迹 信息 接 人 转发 5 秒 钟 系统 
城管 执法 车 位 置 及 运动 轨 bi 3 GPS 全 球 定位 
城管 执法 部 门 迹 信息 接 人 转发 5 秒 钟 系统 
=l 民 防 部 门 视频 监控 信息 系统 对 接 实时 高 清 摄像 头 
危险 品 运 输 车 位 置 及 运动 Y GPS 全 球 定 位 
交通 部 门 轨迹 信息 接 人 转发 5 秒 钟 系统 
公安 部 门 视频 监控 信息 系统 对 接 实时 高 清 摄像 头 
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第 5 章 ”智慧 城市 多 源 信息 协同 的 自 适应 
模式 


信息 协同 模式 是 多 源 信息 协同 体系 的 核心 部 分 ,与 信息 协同 评价 之 间 
形成 系统 内 部 信息 流转 的 闭环 流程 ,根据 信息 协同 网 络 的 测度 结果 进行 信 
息 协 同 模式 的 自 适应 优化 。 本 章 重 点 介绍 多 源 信息 协同 的 模式 及 其 自 适应 
的 智能 化 过 程 。 根 据 智 慧 城市 的 大 数据 特征 和 应 用 需求 ,分 析 不 同业 务 需 
求 下 的 信息 协同 模式 ,通过 改变 信息 的 流向 对 传统 模式 下 的 信息 流转 进 
优化 ;根据 信息 协同 不 同 阶段 的 特点 构建 信息 流转 的 自 适应 进程 ,实现 信息 
协同 技术 流程 与 业务 流程 的 分 离 , 最 终 实 现 信息 在 城市 系统 中 智慧 地 流转 。 


51 智慧 城市 系统 下 的 信息 特征 与 流向 分 析 


智慧 城市 系统 中 流转 的 信息 可 以 归纳 为 业务 信息 和 日 志 信 息 两 大 类 。 
其 中 业务 信息 主要 包括 普通 的 业务 信息 、 来 自 于 物 联 终端 的 实时 感知 信息 、 
视频 信息 等 三 种 类 型 ,日 志 信 息 主 要 指 信 息 流转 过 程 中 产生 的 事件 信息 和 
状态 信息 。 普 通 业务 信息 一 般 可 以 按 业务 部 门 的 领域 职能 和 业务 流程 进行 
划分 ;视频 信息 在 信息 载体 和 特征 上 具有 自身 的 特殊 性 ;对 实时 感知 信息 的 
分 类 是 关键 ,这 就 需要 对 实时 感知 信息 的 特征 进行 合理 的 描述 。 

信息 分 类 是 信息 特征 分 析 的 基础 。 多 维 信息 的 分 类 需要 在 基础 指标 基 
础 上 构建 多 维度 指标 体系 的 关联 关系 ,在 分 类 过 程 中 遵循 基础 分 类 与 辅助 
分 类 相 结 合 、 求 大 同 存 小 异 、 用 语 规 范 性 与 灵活 性 相 结 合 、 具 有 层次 性 和 可 
扩展 性 等 基本 原则 。 多 维 信息 的 分 类 方法 如 图 5. 1 所 示 。 

智慧 城市 的 物 联 信 息 特征 可 以 按照 人 、 地 .事物 .组织 、 领 域 .时 间 七 个 
维度 进行 描述 ,如 表 5.1 所 示 。 
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内 外 现 有 分 类 物 联 信息 来 源 及 应 急 辅助 决策 
及 编码 规范 分 析 资源 形态 分 析 


应 用 分 析 


基础 分 类 | eee 数据 编码 
方法 确定 


法 补充 规范 确定 


面向 管理 者 分 类 分 析 


一 级 


€ 
G 


S AE: lates. E at E Ee E E e EE 


> a) 编码 方法 


D &® © 


图 5.1 多 维 信息 分 类 方法 


表 5.1 智慧 城市 的 物 联 信息 特征 


面向 空间 位 置 分 类 分 析 
事件 分 类 分 析 
物体 分 类 分 析 


部 门 分 类 分 析 


面向 时 间 分 类 分 析 


信息 维度 特征 描述 核心 因素 

人 信息 的 组 织 、 存 储 与 应 用 信息 的 管理 者 
Wi, 地 /空间 | 反映 城市 体征 状态 的 关键 空间 实体 “天 地 一 体 化 ”| 空间 实体 位 置 

事件 信息 与 事件 的 关联 关系 应 急事 件 

物 信息 的 对 象 主体 感知 设备 和 管理 对 象 

组 织 横向 跨 部 门 纵向 跨 层级 信息 的 所 属 部 门 

领域 信息 的 业务 领域 服务 主题 

时 间 信息 的 过 程 状 态 ( 动 态 ) 和 结果 状态 (静态 ) 信息 产生 /需求 的 频率 


(1) 按 “ 人 ”的 信息 维度 描述 : 如 “提供 方 的 信息 ”“ 使 用 方 的 信息 ”“ 管 


理 方 的 信息 
(2) 按 * 地 /空间 ”的 信息 维度 描述 : 如 * 地 下 管线 信息 ”( 地 下 )“ 公 交 线 
路 信息 (地表 )“ 空 气质 量 信息 ”( 地 上 ) 等 。 
G) 按 “ 事 件 ” 的 信息 维度 描述 : 如 “安全 防汛 信息 ”“ 森 林 防 火 信息 ”、 


息 ” 等 。 


142 “ 扫 雪 铲 冰 信息 ”等 。 


(4) 按 * 物 ”的 信息 维度 描述 : 如 * 烟 花 爆 竹 仓 库 的 温度 信息 ” 
险 车 辆 的 位 置信 息 ”“ 电 梯 的 运行 状态 信息 ”等 。 

(5) 按 “ 组 织 ” 的 信息 维度 描述 : 如 “城管 部 门 信 息 ”“ 市 政 部 门 信息 ”、 
“水 务 部 门 信息 ”等 

(6) 按 “ 领 域 ” 的 信息 维度 描述 : 如 “气象 领域 专题 信息 ”“ 交 通 领域 专 
题 信息 ”“ 城 市 生命 线 领域 专题 信息 ”等 。 

(7) 按 * 时 间 ” 的 信息 维度 描述 : 如 “自动 气象 站 的 位 置信 息 ”( 静 态 )、 
“气象 云图 的 实时 信息 ”( 秒 级 动态 ) 等 。 

智慧 城市 的 大 数据 特征 突出 体现 对 海量 实时 感知 信息 的 共享 与 整合 。 
如 何 让 城市 系统 运行 的 状态 信息 .事件 信息 和 决策 信息 以 最 快 的 速度 .最 优 
的 模式 (路 径 ) 从 信息 源流 向 需求 方 ,决定 了 城市 管理 决策 的 效率 ,进而 直接 
影响 城市 安全 运行 公共 服务 和 应 急 决策 的 水 平 。 智 慧 城市 运行 管理 的 信 
息 流向 分 层 架构 如 图 5. 2 所 示 。 


智慧 城市 运行 管理 与 应 急 决策 i j 
全 面 


z 


aje 
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ER 融合 可 视 化 
感知 视图 信息 空间 化 
Se EES 基础 支撑 平台 O eee ee 
1 ”统一 编码 O BACE !' 整合 融合 ”| 人 ”智能 分 析 | 


安全 | | 市 政 
环保 
DE | | 领域 | | 领域 | | 领域 


图 5.2 智慧 城市 运行 管理 的 信息 流向 分 层 架构 Haee 
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过 城市 运行 管理 部 门 应 用 的 信息 交换 和 领域 应 用 的 信息 接 入 ,将 多 
源 异 构 的 数据 与 人 口 法人、 地 理 空间 等 基础 信息 资源 进行 整合 ,最 终 形成 
的 融合 信息 进一步 应 用 于 城市 运行 管理 的 各 个 部 门 和 领域 业务 ,实现 信息 
流转 的 闭环 管理 ( 见 图 5. 3)。 


l 

R ， 领域 应 用 
部 门 应 用 | 
— | 
门 应 用 | | 
l 
| 
l 


信 
e | | (ante | | 感知 设备 | - | 
n T as [gaze 目录 信息 | | 管理 信息 


SHU BES e+ seks tS— AS ose 


_—S—7 
临时 信息 | | 加 工 信 息 


Es 政治 中 | 
EA 主题 信息 


ee 
管 主题 信息 


应 急 车 辆 定 | 
位 主题 信息 | 


二 
1 
下 基础 信息 资源 一 


图 5.3 智慧 城市 运行 管理 的 信息 流转 闭环 模型 


应 用 案例 4 城市 基础 运行 领域 的 物 联 实体 分 类 


某 智慧 城市 基础 运行 管理 领域 的 管理 对 象 分 类 如 表 5. 2 所 示 。 
感知 设备 分 类 如 表 5. 3 所 示 。 
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R52 某 智慧 城市 基础 运行 管理 领域 的 管理 对 象 分 类 


一 级 分 类 二 级 分 类 
消防 战斗 车 、 重 型 专项 作业 车 、 中 型 专项 作业 车 、 消 防 指挥 车 、 泡 沫 消 
防 车 、 气 防 车 、 备 用 车 指挥 车 、 后 勤 车 、 消 防 战 斗 车 干粉 泡沫 联 用 车 、 
应 急 指 挥 车 .抢险 车 、 发 电 及 发 电 辅助 用 车 .吊车 ,拖车 ,挖掘 机 、 工 程 

车 辆 抢险 车 、 高 压 注 浆 机 、 钴 机 、 应 急 指挥 通信 车 、 铲 雪 车 、 防 洪 车 、 货 车、 专 
用 客车 . 拖 板 车 ,振动 压路机 、 轮 式 挖掘 破碎 机 、 拖 车 式 电站 、 防 洪 车 、 
铲 雪 车 、 酒 水 车 、 应 急 供水 车 、 城 市 管理 综合 执法 保障 车 辆 、 环 境 监 测 
车 ,公交 车 辆 \ 出 租车 辆 ,长 途 巴 士 、 通 信和 车 辆 ,救护 车 ,垃圾 车 、 渣 土 运 
输 车 .清扫 车 …… 

道路 桥梁 桥梁 、 重 点 桥 区 ,市 内 道路 、 高 速 公 路 、 重 点 路 面 、 高 边 坡 …… 

交通 站 点 公交 车 站 ,汽车 总 站 ,长 途 客 运 站 、 轨 道 交通 车 站 出 入 口 .轨道 交通 换 

se 乘 通道 .轨道 交通 站 台 …… 

供电 设施 电力 联络 线 、 输 电线 路 、 固 定 施工 场所 、 非 民用 用 电 设施 …… 

供水 设施 0 E 
污水 处 理 厂 .再生水 厂 ,污水 排水 管 网 ,十 污水 泵 站 、 再 生 水 输 配 管 网 、 

排水 设施 再 生 水 提升 泵 站 、 废 水 总 排 口 . 排 人 水 口 、 污 水 处 理 站 、 上 废水 总 排 
Dw 

供 热 设 施 热 热源 厂 .锅炉 .热力 管线 小室 .热力 站 …… 

燃气 设施 燃气 门 站 ,燃气 调 压 站 , 非 民 用 燃气 设施 …… 

通信 设施 光缆 .有线 电视 …… 

应 急 避 难 场所 、 民 防 工程 消防 中 控 室 、 民 防 高 点 、 玻 散 通道 安全 出 

A Bi T.E | R 

监测 站 点 环境 监测 点 .噪声 监测 点 .气象 监测 站 高速 公路 气象 监测 站 高 山 气 
r EEA 
AE E E fé BE St BH TER Nr dit PA PE fé AE ia E Da n AAE BE 

危险 化 学 品 | 竹 销售 点 SOON Hae Sa Ht OK h BK de FREK RIRI E A 
危 化 品 工作 区 .原料 灌区 .燃气 锅炉 房 …… 

建筑 工程 公园 . 主 景区 广场 .休闲 娱乐 场地 .景区 制高点 .建筑 物 高 点 ,学校 …… 

特种 设备 电梯 .起 重 机械. 大 型 游乐 设施 …… 
露天 采 场 炼油 厂 、 辅 助 车 间 、 排 土 场 、 井 下 、 尾 矿 库 、 矿 山地 面 、 矿 山 外 

厂矿 设施 围 ,水 泵 ` 风门 .皮带 .道岔 .锅炉 .厂房 车 间 、 设 备 控制 室 ,总 配 电 
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表 5.3 某 智慧 城市 基础 运行 领域 的 感知 设备 分 类 


一 级 分 类 二 级 分 类 


温度 计 / 温 度 传感器 ,湿度 传感器 ,红外 探测 器 、 空 气质 量 传感器 、 噪 声 
传感器 风速 传 感 器 、 风 向 传感器 气压 传感器 、 降 水 传感器 、 力 /重量 
传感器 .加 速度 传感器 .流量 传感器 .位移 传感器 .尺度 传感器 . 浊 度 传 
感 器 、 密 度 传感器 .黏度 传感器 、 硬 度 传感器 .热流 传感器 ` 热 导 率 传 感 
器 、 图 像 传 感 器 、 色 传感器 、 激 光 传感器 、 磁 场 强 度 传感器 、 磁 通 密度 传 
感 器 ,电流 传感器 电压 传感器 、 电 场 传感器 、 超 声波 传感器 、 声 压 传 感 
器 声 表面 波 传感器 .射线 传感器 .辐射 剂量 传感器 ,气体 分 压 传感器 、 
PH 传感器 .成 分 传感器 ,离子 活 度 传感器 ,水 分 传感器 , 心 电 传 感 器 、 
血 氧 传感器 ,体温 传感器 、 血 压 传 感 器 ,微生物 传感器 ,细胞 传感器 ,组 
织 传感器 .免疫 传感器 、 酶 传感器 .生命 探测 装置 …… 


传感器 


视频 监控 设备 | 模拟 摄像 头 \ 标 清 摄 像 头 ,高 清 摄像 头 …… 


CNSS( 区 域 性 有 源 三 维 卫星 定位 与 通信 系统 .北斗 卫星 导航 系统 )、 


aa GPS( 全 球 定位 系统 ) 、 基 站 定位 …… 


射频 识别 设备 | 射频 识别 只 读 器 .射频 识别 读 写 器 …… 


52 城市 系统 下 的 多 源 信 息 协 同 模式 


521 多 源 信 息 协 同 的 应 用 模式 


传统 城市 系统 下 的 多 源 信 息 协 同 以 信息 组 织 间 的 信息 共享 为 主 ,信息 
协同 模式 比较 单一 ,主要 是 中 心 管理 模式 。 智 慧 城市 系统 下 的 多 源 信息 协 
同根 据 其 大 数据 的 特征 及 科学 决策 对 信息 实时 性 的 要 求 , 需 要 综合 采用 多 
种 新 的 模式 ,主要 分 为 信息 共享 (信息 组 织 间 的 信息 协同 ) 和 接 人 转发 (实时 
感知 信息 的 协同 ) 两 类 。 

信息 共享 模式 主要 包括 中 心 管理 ,中心 转发 .节点 对 接 和 领域 应 用 四 种 
模式 ( 见 表 5. 4)。 


R54 智慧 城市 运行 管理 的 信息 共享 模式 


模式 类 型 标 识 模式 描述 协同 关系 
中 心 管理 模式 PCP 中 心 管理 .不 落地 一 对 一 

中 心 转发 模式 PCN/NCP 中 心 管理 ,落地 一 对 多 、 多 对 一 
节点 对 接 模 式 P2P 自行 管理 .不 落地 一 对 一 
领域 应 用 模式 P2N 二 级 中 心 管理 一 对 多 


1. 中 心 管理 模式 (POP) 

PCP 模式 由 管理 中 心 来 配置 端 到 端的 流程 ,包括 控制 流 、 消 息 流 和 数据 
流 , 对 端 节点 业务 应 用 提供 服务 。 参 与 协同 的 节点 通过 前 置 机 方式 接 入 管 
理 中 心 , 流 程 的 配置 和 控制 (包括 信息 在 流转 过 程 中 的 传输 和 处 理 ) 由 管理 
中 心 完 成 。 

PCP 模式 应 用 于 信息 组 织 之 间 一 对 一 共享 的 情况 ,协同 信息 原则 上 不 
在 交换 中 心 落地 ,适合 业务 需求 明确 (一 定时 期 内 无 频繁 变化 ) 、 信 息 协 同 能 
力 相 对 薄弱 的 信息 组 织 。PCP 模式 的 信息 流向 如 图 5.4(a) 所 示 。 


pke—-e—-ejik 节点 en 
中 心 
中 心 


(a)PCP 模 式 (b)PCN 模 式 
和 点 一 一 一 和 和 点 the 节点 
` 7 ~ 
Se SA he 
‘se ~@- 
中 心 中 心 
(c) P2P 模 式 (d) P2N 模 式 


图 5.4 信息 共享 模式 的 信息 流向 示意 图 


2 中心 转发 模式 (PONNCP) 


PCN/NCP 模式 将 信息 协同 流程 分 成 两 个 阶段 ,从 发 送 方 节点 到 管理 中 
心 ,再 由 管理 中 心 到 需求 方 节点 。 中 心 端 根据 业务 需求 进行 必要 的 数据 整 
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合 与 转化 。 该 模式 包括 三 种 情况 : 

(1) PCN 模式 : 由 发 送 方 节点 配置 信息 发 送 流程 ,中 心 端 配置 信息 转发 
流程 和 信息 接收 流程 。 

(2) NCP 模式 : 由 中 心 端 配置 信息 发 送 流程 和 信息 转发 流程 ,需求 方 节 
点 配置 信息 接收 流程 。 

(3) PCN 与 NCP 结合 的 模式 : 由 双方 节点 分 别 配置 信息 发 送 流程 和 信 
息 接收 流程 ,中 心 端 配置 转发 流程 进行 对 接 ,完成 信息 协同 的 全 过 程 。 中 心 
端 制定 标准 ,配置 节点 间 流 程 ( 不 含 节点 内 部 流程 ) ,中 心 将 流程 (服务 接口 ) 
授权 (可 视 ) 给 节点 部 门 用 于 对 接 工作 ,各 参与 业务 的 部 门 配置 本 部 门 节 点 
流程 (服务 ) 与 中 心 对 接 。 

PCN/NCP 模式 应 用 于 信息 组 织 之 间 一 对 多 共享 的 情况 ,协同 信息 需要 
在 中 心 端 落地 或 加 工 (整合 ) 后 转发 。 该 模式 中 信息 提供 方 与 信息 需求 方 不 
明确 ,需要 数据 进行 不 确定 多 向 流转 或 不 确定 并 发 流转 。PCN 模式 的 信息 
流向 如 图 5. 4(b) 所 示 。 

3 节点 对 接 模 式 (P2P) 

P2P 模式 是 在 两 个 节点 间 进 行 直 接 信息 协同 的 模式 ,管理 中 心 不 参 与 
流程 与 业务 的 管理 和 控制 。 在 管理 中 心 的 授权 下 ,提供 方 节点 和 需求 方 节 
点 自行 配置 信息 发 送 和 接收 的 流程 ,管理 中 心 对 信息 协同 过 程 进行 监管 。 

P2P 模式 应 用 于 业务 需求 频繁 ,信息 协同 双方 技术 体系 成 熟 ( 信 息 协 同 
程度 较 高 ) 的 信息 组 织 之 间 。P2P 模式 的 信息 流向 如 图 5.4(c) 所 示 。 

4 领域 应 用 模式 (P2N) 

P2N 模式 以 应 用 领域 的 业务 牵头 部 门 ( 主 业务 节点 ) 为 二 级 管理 中 心 ， 
组 织 领域 范围 内 的 相关 部 门 开展 信息 协同 。 由 主 业 务 节 点 制定 标准 ,配置 
业务 节点 流程 (服务 ) ,并 将 流程 (服务 接口 ) 授 权 ( 可 视 ) 给 相关 参与 部 门 ; 各 
参与 部 门 配置 本 部 门 节点 流程 (服务 ) 与 主 业务 节点 流程 (服务 ) 对 接 。 

P2N 模式 应 用 于 业务 重要 性 和 独立 性 强 、 领 域 相关 部 门 间 有 明确 的 业 


务 主 从 之 分 .牵头 部 门 技术 体系 成 熟 ( 信 息 协同 程度 较 高 ) 的 情况 。 该 种 模 
式 改 变 了 传统 的 “1 个 管理 中 心 十 N 个 应 用 节点 ”的 结构 ,形成 了 “1 个 管理 
中 心 十 M 个 领域 应 用 中 心 十 N 个 应 用 节点 ”的 二 级 (或 多 级 ) 信 息 协同 体系 ， 
将 应 用 和 管理 的 功能 从 中 心 端 适 当下 放 , 利 于 信息 在 跨 层级 间 的 灵活 架构 
和 快速 流转 。P2N 模式 的 信息 流向 如 图 5.4(d) 所 示 。 

接 入 转发 模式 主要 通过 物 联 数据 专 网 和 接 入 移动 网 络 ,将 感知 设备 的 
实时 感知 信息 统一 接 人 到 交换 中 心 , 由 中 心 对 感知 信息 网 络 包 进行 解码 处 
理 , 获 取 接 和 人 网 关 的 ID 等 信息 ,进行 白 名 单 验证 和 部 门 转发 关系 映射 。 接 
入 转发 的 信息 流转 主要 包括 直接 转发 .存储 转发 和 存储 分 发 三 种 模式 ( 见 
R Sbe 


表 5.5 接 入 转发 模式 


模式 类 型 模式 描述 
直接 转发 模式 | 将 验证 通过 的 网 络 包 直接 转发 至 信息 需求 方 


存储 转发 模式 | 直接 转发 的 同时 ,同步 存储 入 库 , 为 多 源 信息 的 整合 融合 提供 支撑 


存储 分 发 模式 | 直接 转发 的 同时 ,根据 需求 同步 分 发 到 其 他 相关 的 信息 需求 方 


接 人 转发 的 信息 流向 如 图 5. 5 所 示 。 


节点 ”中心 o 节点 a 节点 
感知 感知 感知 


直接 转发 模式 接 入 转发 模式 接 入 分 发 模式 
图 5.5 接 入 转发 模式 的 信息 流向 示意 图 


接 入 转发 模式 改变 了 传统 的 城市 系统 下 的 信息 流向 ,信息 不 再 全 部 由 
源头 部 门 获取 后 通过 交换 中 心 共享 ,而 是 根据 决策 需求 选择 由 中 心 直 接 从 
信息 源 获取 后 转发 ,一 方面 利于 提高 实时 信息 的 流转 效率 , 另 一 方面 利于 对 
跨 领 域 信息 的 关联 整合 ,提高 决策 支持 的 水 平 。 
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522 多 源 信 息 协 同 模式 的 流程 分 析 


信息 协同 模式 通过 信息 协同 流程 实现 ,主要 包括 多 源 信息 协同 的 数据 
交换 流程 .管理 监控 流程 .运行 管理 流程 .事件 通知 流程 信息 同步 流程 、 节 
点 部 署 流程 和 业务 建 模 运行 流程 七 种 类 型 ,下 面 对 各 类 流程 分 别 进行 分 析 。 

1. 多 源 信息 协同 的 数据 交换 流程 

(1) 数据 从 信息 提供 方 的 业务 系统 或 业务 数据 库 中 进行 提取 ,通过 桥接 
系统 置 于 前 置 数据 库 中 (或 直接 调用 交换 中 间 件 提供 的 API 接口 ), 从 而 进 
入 交换 流程 ,如 图 5.6 所 示 。 


! 数据 交换 流程 | 
er | a 
[aN | | ws) 

| aire 前 置 库 N | 

1 i} 

1 i} 

1 | 

1 i} 


交换 交换 
中 间 件 中 间 件 


三 


图 5.6 数据 交换 流程 


(2) 交换 中 间 件 从 前 置 数据 库 中 监控 到 数据 的 变化 (或 调用 APD 后 , 待 
交换 的 数据 被 处 理 和 发 送 。 

(3) 通过 数据 交换 流程 到 达 信 息 需求 方 的 交换 中 间 件 ,经 处 理 后 进入 需 
求 方 前 置 数据 库 , 再 经 桥接 系统 进入 需求 方 的 业务 系统 (或 直接 经 桥接 系统 
进入 需求 方 业务 系统 ) 。 

2 多 源 信 息 协 同 的 管理 监控 流程 

1) 管理 中 心 的 管理 监控 

管理 中 心 的 事件 通知 流程 和 管理 监控 流程 如 图 5.7 所 示 。 

管理 中 心 的 管理 监控 主要 包括 三 个 方面 : 一 是 信息 协同 中 间 件 的 运行 
管理 (如 中 间 件 的 远程 启动 .停止 等 ); 二 是 数据 处 理 流 程 ( 业 务 ) 调 度 配置 ; 
三 是 数据 传输 连接 器 配置 (对 连接 器 JDBC, JMS, FTP, HTTP (s), 


一 一 一 一 > 事件 通知 ———> 管理 监控 


图 5.7 管理 中 心 的 事件 通知 流程 和 管理 监控 流程 


WebService, REST 等 的 参数 配置 管理 ) 。 

其 中 ,数据 处 理 流 程 主 要 包括 三 种 调度 策略 : 一 是 实时 策略 ,基于 事件 
驱动 .动态 产生 和 控制 的 信息 协同 方式 ;二 是 定时 策略 ,由 定时 器 根据 预 设 
的 定时 策略 产生 和 控制 的 信息 协同 方式 ;三 是 手工 策略 ,由 用 户 手动 产生 和 
控制 的 信息 协同 方式 。 调 度 策略 与 业务 需求 及 建 模 存在 密切 联系 。 

2) 信息 协同 节点 的 管理 监控 

管理 中 心 通过 节点 管理 器 实现 对 信息 协同 节点 、 信 息 协同 中 间 件 及 前 
置 数据 库 的 运行 状态 监控 。 管 理 监 控 对 象 如 图 5. 8 所 示 。 

信息 协同 节点 的 运行 状态 监控 主要 包括 四 个 方面 : 一 是 节点 服务 器 

行 监控 ,如 硬盘 占用 内 存 占用 .CPU 等 情况 ,设置 报警 阔 值 ,超过 阔 值 
后 实时 报警 ;二 是 信息 协同 中 间 件 运行 监控 ,采用 轮 询 方式 ,监控 中 间 件 的 
运行 状态 ,如 就 绪 、 和 运行、 停止. 挂 起 .异常 等 ;三 是 数据 处 理 ( 业 务 ) 流 程 监 
控 , 采 用 实时 交互 方式 ,通过 中 间 件 的 JMX 接口 监控 部 署 数据 处 理 流 程 
(及 组 件 ) 的 运行 状态 ,如 就 绪 、 进 行 、 处 理 完成 .回执 确认 、 处 理 中 断 、 异 常 
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信息 协同 节点 
(业务 中 心 、 前 置 节点 ) 


节点 管理 信息 协同 中 间 件 前 置 库 


数据 处 理 流 程 连接 器 数据 传输 通道 


[Lar 


图 5.8 管理 监控 对 象 


等 ;四 是 节点 数据 传输 通道 监控 ,采用 实时 交互 方式 ,通过 中 间 件 的 JMX 
接口 监控 数据 传输 通道 的 有 效 性 ,通过 JMS 方 式 监控 队列 中 待 处 理 消息 
的 情况 。 

信息 协同 中 间 件 主要 监控 数据 处 理 流程 、 连 接 器 、 数 据 传输 通道 及 相关 
组 件 。 各 监控 对 象 的 属性 包括 : 名 称 、 类 别 ( 数 据 处 理 流程 、 连 接 器 \ 数 据 传 
输 通道 ,组 件 等 )、 所 属 节点 、 所 属 业 务 ( 包 含 若干 任务 )、 所 属 任 务 ( 对 应 某 项 
业务 ) 等 。 

3. 多 源 信息 协同 的 运行 管理 流程 

信息 协同 过 程 中 进行 强 日 志 管 理 ,并 提供 基于 Web 的 日 志 查 询 。 对 不 
同 的 信息 协同 流程 日 志 进 行 汇总 ,实现 按时 间 范 围 . 流 入 /流出 .提供 /需求 、 
信息 载体 等 多 维度 的 统计 。 日 志 查询 流程 和 汇总 流程 如 图 5. 9 所 示 。 

4 多 源 信息 协同 的 事件 通信 流程 

信息 协同 节点 (节点 管理 器 .中 间 件 .数据 处 理 流程 .组 件 等 ) 在 运行 过 
程 中 与 管理 中 心 之 间 进 行 双向 的 事件 通信 ,管理 中 心 对 事件 消息 进行 统一 
管理 和 监控 。 事 件 通 信 流 程 如 图 5. 10 所 示 。 

5 多 源 信 息 协 同 的 信息 同步 流程 

实现 管理 中 心 到 业务 中 心 的 基础 信息 同步 ,从 而 实现 业务 中 心 的 独立 


运行 。 


信息 协同 节点 信息 协同 节点 


信息 协同 节点 信息 协同 节点 


图 5.9 日 志 查 询 流 程 和 汇总 流程 


6 多 源 信息 协同 的 节点 部 署 流程 

在 信息 协同 节点 部 署 节点 管理 器 和 信息 协同 中 间 件 ,信息 协同 中 间 件 
在 节点 管理 器 上 进行 注册 并 提供 相应 的 功能 脚本 ,注册 信息 写 入 节点 管理 
器 的 配置 文件 进行 管理 。 
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监控 服务 
> 


信息 协同 管理 


\ 


事件 管理 


信息 协同 节点 


一 一 > 事件 通信 


一 一 一 全 运行 监控 


图 5.10 事件 通信 流程 


7 多 源 信息 协同 的 业务 建 模 运 行 流程 

信息 协同 的 业务 建 模 运行 流程 主要 包括 四 个 阶段 : 一 是 业务 规划 及 业 
务 建 模 ,在 管理 中 心 注册 业务 ,规定 业务 域名 称 (在 建 模 及 JMX 接口 实现 中 
使 用 ) ;二 是 数据 交换 建 模 , 按 照 业务 流程 和 信息 协同 需求 进行 建 模 , 定 义 数 
据 的 抽取 、 转 换 、 校 验 、 加 载 等 ,并 定义 异常 处 理 流程 ,保证 处 理 异常 能 够 及 
时 被 捕获 并 通知 管理 中 心 ;三 是 部 署 ,将 所 建 好 的 数据 处 理 流程 发 布 到 远程 
前 置 节 点 并 进行 测试 ,将 该 流程 的 相关 管理 监控 接口 注册 到 管理 中 心 并 进 
行 测试 ,数据 处 理 流程 的 部 署 和 外 载 均 在 管理 中 心事 件 管理 器 中 进行 事件 
通知 ;四 是 运行 管理 监控 ,通过 管理 中 心经 由 所 注册 的 接口 进行 管理 监控 。 
业务 建 模 运行 流程 如 图 5. 11 所 示 。 


LERMA || sexi |) wa 运行 管理 
MEI || ODER |_| (HEMET |_| warm 
owai |Lo samen || orun || omma 


图 5. 11 业务 建 模 运行 流程 


53 城市 系统 下 的 多 源 信 息 协 同 自 适应 过 程 


531 多 源 信 息 协 同 的 阶段 


根据 城市 系统 下 的 信息 流转 方式 和 特点 ,信息 协同 的 全 流程 分 为 信息 
启动 .信息 流转 、 信 息 到 达 三 个 阶段 ,各 阶段 的 信息 整合 方式 和 整合 内 容 可 
概括 为 表 5.6 的 形式 。 


表 5.6 城市 系统 下 的 信息 协同 阶段 


FENA KASSER NFIF Wa 


信息 协同 阶段 信息 整合 方式 信息 整合 内 容 

信息 启动 阶段 聚 类 整合 信息 的 分 类 

信息 流转 阶段 加 工整 合 、 关 联 整合 信息 的 转换 和 关联 

信息 到 达 阶 段 业务 整合 信息 技术 流程 与 业务 流程 的 对 接 


1. 信息 启动 阶段 
根据 信息 的 分 类 标准 ,对 信息 进行 多 维度 的 精细 化 分 类 。 不 同 维度 的 akiai 
分 类 信息 之 间 存 在 交叉 ,分 类 的 维度 和 粒度 关系 到 流转 阶段 和 到 达 阶 段 的 
信息 定位 与 整合 。 在 信息 分 类 的 基础 上 ,根据 提供 方 的 业务 需求 和 业务 规 
则 选择 不 同 的 共享 方式 ,主要 包括 公开 、 普 适 共 享有 限 共 享 、 特 定 共享 和 专 
用 五 种 情况 ,如 表 5.7 所 示 。 


表 5.7 城市 系统 下 的 信息 共享 方式 


共享 边界 面向 对 象 共享 关系 信息 实证 
公开 | 全 社会 — | 气象 部 门 的 天 气 预 报信 息 

普 适 共享 | 所 有 政府 部 门 一 对 多 | 地 理 空间 的 基础 图 层 信息 

有 限 共享 | 特定 领域 或 特定 事件 相关 的 部 门 | 一 对 多 | 环保 部 门 的 环境 噪声 信息 

特定 共享 | 具体 业务 需求 指定 的 特定 部 门 | 一 对 一 | 公安 部 门 的 高 清 视频 信息 E 
专用 部 门 内 部 使 用 一 | 依法 保密 的 相关 涉 密 信息 | 
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2 信息 流转 阶段 

在 流转 阶段 对 信息 的 内 容 、 数 量 . 阔 值 等 的 规范 性 和 合理 性 进行 监控 ， 
并 根据 需求 进行 信息 的 加 工 转换 和 多 源 信息 间 的 关联 整合 。 信 息 流 转 阶段 
是 信息 协同 过 程 中 的 核心 环节 ,主要 包括 信息 交换 、 信 息 接 人 和 信息 整合 三 
个 方面 。 

信息 交换 模型 如 图 5. 12 所 示 。 
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图 5.12 城市 系统 下 的 信息 交换 模型 
信息 接 入 模型 如 图 5.13 所 示 。 
信息 整合 模型 如 图 5. 14 所 示 。 
3. 信息 到 达 阶 段 


在 信息 的 到 达 阶 段 实 现 “ 前 置 机 一 业务 库 ” 的 对 接 , 解 决 信息 流转 过 程 
中 的 “最 后 一 公里 ”问题 。 
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图 层 、 街景 


图 5.14 城市 系统 下 的 信息 整合 模型 


532 多 源 信息 协同 的 自 适应 进程 


多 源 信息 协同 的 自 适应 优化 是 体现 城市 系统 下 信息 智慧 流转 的 核心 环 
节 。 在 智慧 城市 信息 化 的 顶层 设计 中 ,信息 流转 的 自 适应 优化 进程 主要 分 


为 三 个 阶段 ( 见 表 5. 8)。 


6 控 | 基础 
监控 支 
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表 5.8 信息 流转 的 自 适应 阶段 


阶段 自 适应 进程 构建 重点 对 接 目 标 

1 业务 流程 的 自 适应 匹配 | 业务 流程 库 | 技术 流程 ~ 业务 流程 

2 业务 规则 的 自 适应 选择 | 业务 规则 库 | 业务 规则 一 业务 流程 一 技术 流程 
3 业务 内 容 的 自 适应 优化 | 应 用 场景 库 应 选择 一 自 适应 优化 


1. 业务 流程 的 自 适 应 匹配 


一 方面 ,由 传统 模式 下 的 先 注册 信息 目录 、 后 开展 信息 交换 ,转变 为 基 
于 需求 直接 开展 信息 交换 ,在 信息 流转 过 程 中 同步 生成 (更 新 ) 信 息 目 录 ; 另 
一 方面 ,通过 建立 技术 流程 与 业务 流程 的 关联 关系 ,可 以 对 信息 流转 的 共享 
情况 、 需 求情 况 、 应 用 业务 、 交 换 频率 等 信息 进行 全 流程 的 网 状 查 询 。 

2 业务 规则 的 自 适 应 选择 

一 方面 ,信息 流转 模式 可 以 根据 业务 规则 进行 自 适 应 选择 , 当 应 用 需求 
(如 信息 产生 的 频率 变 快 ,出 现 新 的 信息 源 等 ) 发 生变 化 时 ,触发 业务 规则 库 
同步 进行 调整 ,信息 协同 体系 能 够 自动 根据 业务 规则 的 变化 自动 进行 调整 ， 
选择 最 合适 的 信息 协同 模式 ; 另 一 方面 ,对 技术 流程 的 调整 可 以 同步 调整 相 
应 的 业务 流程 和 业务 规则 库 。 

3 业务 内 容 的 自 适应 优化 

一 方面 ,通过 自 适应 选择 过 程 中 对 技术 流程 的 调整 , 反 过 来 调整 不 合理 
的 业务 规则 ; 男 一 方面 ,通过 不 同 应 用 场景 下 的 反复 学 习 和 优化 ,将 通用 的 
自 适 应 选择 过 程 模式 化 ,不 断 完善 基于 情景 推演 的 快速 决策 场景 。 

多 源 信息 协同 自 适 应 优化 的 三 个 阶段 体现 了 信息 协同 智能 化 的 不 同 程 
度 , 其 中 ,业务 规则 的 自 适应 选择 和 业务 内 容 的 自 适应 优化 形成 一 个 不 断 循 
环 迭 代 的 过 程 ,如 图 5.15 所 示 。 

信息 协同 自 适 应 优化 的 智能 过 程 是 未 来 发 展 的 重点 方向 。 业 务 流程 的 
自 适 应 匹配 阶段 已 具备 一 定 的 业务 基础 和 技术 基础 ,但 业务 规则 的 自 适应 
选择 和 业务 内 容 的 自 适应 优化 两 个 阶段 需要 在 智能 化 方面 开展 进一步 研 


@ 自 适应 选择 
____ 需求 变化 (规则 更 新 ) ____ 
| i a T 
事件 一 一- [业务 流程 库 业务 规则 库 | 交换 -| 技术 流程 库 
te | omenit 
OREN 


B 5.15 多 源 信息 协同 的 自 适 应 进程 


究 。 其 中 , 自 适应 选择 的 智能 化 重点 在 于 需求 变化 触发 规则 变化 后 ,模式 自 
适应 调整 的 及 时 性 、 准 确 性 和 总 体 资源 的 合理 分 配 ; 自 适应 优化 的 智能 化 重 
点 在 于 对 大 量 场景 和 案例 的 反复 变化 和 选择 过 程 中 ,对 模式 和 规则 之 间 的 
最 优化 关联 。 


533 事件 驱动 的 多 源 信 息 融 合 


基于 事件 驱动 的 多 源 信息 融合 需要 构建 “数据 -方法 -应 用 "三 元 组 ,其 基 
本 范式 如 下 : 

Soenario= {Data, Mothod, Application} 

Data= {基础 信息 ,专题 信息 ,事件 信息 } 

Mpthod= { 关 联 规 则 挖掘 方法 } 

BEPlicationr {基础 信息 ,专题 信息 与 事件 的 关系 } 

上 述 范 式 简 记 为 S=(D. M,，A}。 其 中 ,基础 信息 主要 包括 人 口 基础 信 
息 .法 人 基础 信息 、 空 间 地 理 基础 信息 、 宏 观 经 济 基础 信息 等 ,专题 信息 包括 
实 有 房屋 专题 信息 .气象 专题 信息 ,交通 专题 信息 ,城市 生命 线 专题 信息 等 。 

利用 上 述 范 式 实现 城市 管理 的 规律 验证 并 进行 预警 .如 流动 人 口 密度 
或 流动 人 口 比例 达到 一 定数 值 会 存在 较 大 的 潜在 事件 发 生 概率 ,并 根据 概 
率 实现 预警 。 

多 源 信息 融合 的 技术 模型 由 数据 转换 引擎 .数据 关联 引擎 ,数据 切 分 引 
擎 ,数据 聚合 引擎 和 信息 服务 引擎 组 成 ( 见 图 5. 16) 。 
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图 5.16 多 源 信息 融合 的 技术 模型 


1. 数 据 转换 引擎 
"I 主要 对 源 数 据 进行 清洗 和 转换 。 数 据 转 换 根据 源 数据 管理 ,对 源 数据 
进行 清洗 和 转换 ,形成 数据 融合 引擎 的 基础 数据 库 。 
2 数据 关联 引擎 
在 基础 数据 和 主题 数据 之 间 建 立 各 种 关联 关系 ,并 形成 关联 数据 库 。 
这 种 关联 包括 数据 库 间 的 关联 .系统 间 数 据 关联 及 与 第 三 方 接口 的 关联 ,并 
将 关联 处 理 采 用 关联 适配器 的 方法 进行 管理 ,实现 动态 建立 和 维护 各 种 关 
联 适 配器 。 关 联 适配器 是 按 定制 的 关联 方法 对 基础 数据 建立 的 关联 ,并 形 
成 关联 数据 。 关 联 适配器 管理 是 对 各 种 关联 适配器 动态 注册 和 注销 的 管 
理 , 实 现 动态 建立 和 维护 各 种 关联 适配器 。 关 联 数据 管理 是 描述 各 个 关联 
适配器 产生 的 关联 数据 的 存储 结构 和 结构 关系 .使 其 他 部 件 能 够 正确 引用 
关联 数据 。 关 联 控制 为 任务 管理 部 件 提供 适配器 目录 ,根据 任务 管理 的 指 
160  ” 令 , 调 用 相应 关联 适配器 ,并 返回 调用 适配器 的 运行 状态 。 


3 数据 切 分 引擎 

数据 切 分 根据 切 分 规则 ,对 关联 数据 进行 切 分 ,并 形成 切 分 数据 库 。 切 
分 规则 管理 是 对 各 种 切 分 方法 的 管理 ,实现 动态 建立 和 维护 各 种 切 分 方法 。 
切 分 数据 管理 描述 各 个 切 分 方法 产生 的 切 分 数据 的 存储 结构 和 结构 关系 ， 
使 其 他 部 件 能 够 正确 引用 切 分 数据 。 切 分 控制 为 任务 管理 部 件 提供 切 分 目 
录 , 根 据 任 务 管理 的 指令 ,调用 相应 切 分 方法 ,并 返回 所 调用 切 分 方法 的 运 
行 状 态 。 

4 数据 聚合 引擎 

数据 聚合 是 根据 聚合 规则 ,对 切 分 数据 进行 聚合 ,并 形成 聚合 数据 库 。 
聚合 规则 管理 是 对 各 种 聚合 方法 的 管理 ,可 实现 动态 建立 和 维护 各 种 聚合 
方法 。 聚 合 数据 管理 描述 各 个 聚合 方法 产生 的 聚合 数据 的 存储 结构 和 结构 
关系 ,使 其 他 部 件 能 够 正确 引用 聚合 数据 。 聚 合 控制 为 任务 管理 部 件 提 供 
聚合 目录 ,根据 任务 管理 的 指令 ,调用 相应 聚合 方法 ,并 返回 所 调用 聚合 方 
法 的 运行 状态 。 

5 信息 服务 引擎 

提供 服务 形式 的 管理 ,主要 包括 信息 交换 、Web 服务 、 网 页 服务 等 多 种 
形式 。 

在 多 源 信 息 协 同 的 自 适应 模式 基础 上 ,需要 进一步 构建 面向 城市 和 区 
域 管理 的 多 维 协同 机 制 。 城 市 和 区 域 的 精细 化 管理 需要 面向 标准 、 技 术 、 应 
用 、 产 业 等 不 同方 面 实现 从 信息 协同 到 决策 行为 的 转化 ( 见 图 5. 17) 。 

(1) 实现 组 织 层面 的 空间 协同 ,通过 区 域 间 的 横向 协同 、 层 级 间 的 纵向 
协同 .部 门 间 的 交叉 协同 实现 城市 和 区 域 管 理 多 源 异 构 信息 的 纵向 汇聚 和 
横向 整合 。 

(2) 实现 业务 层面 的 领域 协同 ,通过 政党 ,政府 .企业 .公众 四 位 一 体 的 
领域 信息 化 在 社会 网 格 中 的 融合 实现 大 数据 对 领域 性 科学 决策 的 智慧 
支撑 。 
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认 知 协同 : 知识 转化 


[决策 层面 ] | 上 信息 科学 ， 上 数据 科学 ， 决策 科学 ， 上 行为 科学 ! 


[业务 层面 ] | ( 电子 党 务 ! (i rae if ATHA) 1 【电子 公务 


[组 织 层面 ] | 多 层级 ! (人 多 区 域 ! 人 多 部 门 1 
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图 5.17 城市 和 区 域 管理 的 多 维 协同 体系 


(3) 实现 决策 层面 的 认 知 协同 ,通过 物理 世界 和 社会 网 络 中 的 大 数据 关 
联 分 析 , 为 解决 智 城市 和 区 域 管理 中 的 空气 质量 、 交 通 拥堵 水 质 监测 、 食 品 
安全 ,公共 安全 ,社区 治理 等 突出 问题 提供 科学 支撑 。 
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第 6 章 ”智慧 城市 多 源 信息 协同 的 总 体 架构 


本 章 重 点 介绍 智慧 城市 多 源 信息 协同 的 总 体 架构 (包括 各 部 分 间 的 接 
口 ) 及 管理 服务 框架 ,对 数据 传输 、 数 据 抽取 、 数 据 转 换 等 传统 技术 和 建 模 过 
程 不 进行 具体 描述 。 


61 多 源 信息 协同 体系 的 技术 架构 


1. 多 源 信息 协同 体系 的 层次 结构 
多 源 信息 协同 体系 的 层次 结构 由 信息 协同 管理 中 心 、 信 息 协同 业务 中 
心 和 信息 协同 节点 三 层 构成 , 见 图 6. 1。 
信息 协同 管理 中 心 


信息 协同 业务 中 心 | | e 信息 协同 业务 中 心 
信息 协同 节点 | [信息 协同 节点 || …… 信息 协同 节点 


图 6.1 多 源 信息 协同 体系 的 层次 结构 


(1) 信息 协同 管理 中 心 : 信息 协同 总 体 架构 的 总 枢纽 和 总 调度 ,部 署 在 
中 心 端 ,提供 对 可 配置 的 信息 交换 、 处 理 与 整合 服务 ,及 对 各 种 应 用 的 综合 
管理 和 服务 集成 ,并 负责 信息 协同 总 体 架构 内 的 统一 授权 、 资 源 分 配 、 运 行 
监控 和 管理 。 

(2) 信息 协同 业务 中 心 (领域 中 心 ): 信息 协同 总 体 架构 的 中 间 层 ,部 署 
在 业务 负责 (领域 牵头 ) 部 门 ,负责 该 领域 的 信息 协同 业务 规则 、 业 务 模式 的 
制定 ,信息 交换 流程 的 设计 、 配 置 、 运 行 监控 和 管理 ,并 负责 对 领域 内 各 个 信 
息 协同 节点 的 授权 管理 。 
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(3) 信息 协同 节点 : 信息 协同 总 体 架构 的 前 置 端 ,部 署 在 各 部 门 ,负责 
实现 与 相关 业务 中 心 之 间 的 信息 交换 。 

2 多 源 信 息 协 同体 系 的 技术 架构 

多 源 信息 协同 体系 的 技术 架构 主要 包括 中 心服 务 总 线 、 中 心 管理 服务 、 
数据 应 用 集成 ,协同 服务 组 件 和 协同 配置 服务 五 个 部 分 。 

(1) 中 心服 务 总 线 : 提供 集中 管理 的 中 心 和 节点 协同 消息 服务 。 

(2) 中 心 管理 服务 : 提供 信息 协同 节点 之 间 和 节点 内 部 (桥接 服务 ) 端 
到 端的 数据 交换 与 整合 服务 。 

(3) 数据 应 用 集成 : 提供 连接 到 中 心 管理 服务 的 信息 协同 流程 设计 、 部 
署 与 监控 服务 。 

(4) 协同 服务 组 件 : 提供 通用 协同 服务 组 件 的 授权 共享 和 调用 服务 , 包 
括 数据 库 适 配器 、 转 换 组 件 . 基 于 内 容 的 路 由 组 件 .Web Service, REST 服务 
组 件 等 ,协同 服务 组 件 支持 JMS、JCA 组 件 标准 。 

(5) 协同 配置 服务 : 提供 中 心服 务 总 线 的 可 视 化 接口 ,同时 为 信息 协同 
中 心 和 信息 协同 节点 提供 全 局 时 间 同 步 服务 。 

除 此 之 外 ,中 心 管理 服务 和 其 他 外 部 通信 服务 实现 对 接 , 保 证 对 事件 及 
异常 消息 的 及 时 传输 和 响应 。 

多 源 信息 协同 体系 的 技术 架构 如 图 6. 2 所 示 。 

3. 多 源 信息 协同 体系 的 通信 和 与 数据 交换 模式 

多 源 信 息 协同 体系 架构 中 主要 存在 管理 监控 通信 数据 交换 通信 、 事 件 
通信 .日志 通信 、 基 本 信息 同步 和 时 间 同 步 六 类 通信 。 

(1) 管理 监控 通信 : 基于 JMX 管理 框架 ,通信 协议 包括 RMI、HTTP 等 
多 种 类 型 。 

(2) 数据 交换 通信 : 支持 消息 中 间 件 .FTP、HTTP 等 多 种 方式 。 

(3) 事件 通信 : 信息 协同 节点 与 信息 协同 中 心 之 间 的 各 类 事件 监控 
通信 。 


图 6.2 多 源 信息 协同 体系 的 技术 架构 


(4) 日 志 通 信 : 信息 协同 流程 的 日 志 汇总 。 

(5) 基本 信息 同步 : 管理 中 心 与 业务 中 心 之 间 的 基本 信息 同步 服务 。 

(6) 时 间 同 步 : 通过 时 钟 同步 协 议 实现 信息 协同 中 心 和 节点 的 统一 
授时 。 

数据 交换 是 多 源 信息 协同 体系 架构 的 核心 ,对 应 不 同业 务 层 次 的 需求 ， 
主要 包括 以 下 三 种 数据 交换 模式 ， 

(1) 批量 、 增 量 单 向 交换 模式 : 一 对 一 或 一 对 多 模式 ,可 以 是 定时 或 实 
时 ,全集 覆盖 或 增 量 交换 ,采用 数据 增 量 触 发 .时 间 规 则 触发 的 事件 驱动 架 
构 (EDA) 异 步 消息 方式 的 交换 技术 ,应 用 于 数据 交换 和 整合 。 

(2) 请 求 /响应 服务 模式 : 数据 分 布 在 各 应 用 领域 内 ,通过 调用 服务 接 
口 获取 数据 ,应 用 于 应 用 服务 整合 。 

(3) 订阅 /发 布 模式 : 信息 提供 方 根据 订阅 规则 向 信息 需求 方 进行 数据 
推送 。 由 于 采用 广播 方式 ,因此 不 适用 于 实时 信息 协同 场景 。 
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62 多 源 信息 协同 体系 的 功能 架构 


1. 中 心服 务 总 线 

中 心服 务 总 线 对 多 源 信息 协同 总 体 架构 进行 集中 控制 ,可 以 作为 其 他 
所 有 信息 协同 节点 的 监控 代理 ,并 确保 信息 一 致 。 主 要 功能 包括 三 个 方面 : 
一 是 在 信息 协同 节点 上 作为 事件 流程 的 一 部 分 来 控制 信息 协同 组 件 的 启动 
和 终止 ;二 是 保持 所 有 信息 协同 节点 、 业 务 组 件 和 事件 流程 的 更 新 状态 ;三 
是 构建 业务 组 件 的 双 节 点 服务 ,实现 信息 协同 主 节点 与 从 节点 的 实时 互 备 。 

多 源 信息 协同 总 体 架 构 采 用 分 布 式 的 组 件 执 行 方式 ,每 一 个 组 件 ( 执 行 
工作 流 的 一 部 分 ) 和 集结 组 件 的 端点 服务 需要 通过 中 心服 务 总 线 进行 远程 
配置 ,主要 包括 : 

(1) 在 多 源 信息 协同 总 体 架构 中 建立 连通 各 节点 服务 的 事件 流程 。 

(2) 执行 存储 功能 ,保持 相关 业务 组 件 及 其 中 的 资源 和 数据 的 历史 
版 本 。 

(3) 以 XML 格式 表示 事件 流 中 的 元 数据 信息 。 

(4) 表现 及 可 用 性 管理 : 保持 信息 协同 网 络 中 所 有 信息 协同 节点 的 状 
态 信息 。 

(5) 事件 跟踪 、 监 视 和 调试 : 保持 信息 协同 网 络 中 所 有 信息 协同 节点 的 
监视 信息 .日 志 信息 和 状态 信息 。 

(6) 安全 控制 : 包括 网 络 / 协 议 层 的 安全 和 用 户 层 的 安全 。 协 议 层 安全 
需要 支持 HTTP 和 SSL 协议 ,用 户 层 安全 主要 防止 通过 节点 传人 错误 或 受 
损 的 数据 。 新 客户 端 连接 到 信息 协同 网 络 中 需要 提供 信任 并 通过 审计 ,中 
心服 务 总 线 通过 下 层 服务 (不 同 的 存储 与 认证 机 制 ) 来 完成 用 户 身 份 的 认证 
并 完成 相应 安全 策略 。 这 一 安全 架构 允许 为 每 个 可 能 在 信息 协同 网 络 中 执 
行 的 操作 进行 访问 控制 ,例如 对 每 个 事件 流 建立 访问 控制 列表 来 识别 哪些 
用 户 拥有 进入 网 络 的 权限 ,对 每 个 业务 组 件 建立 访问 控制 列表 来 识别 该 业 


务 组 件 在 网 络 中 得 以 运行 的 地 点 。 

(7) 失效 转移 管理 : 当 一 个 业务 组 件 的 主 节 点 运行 崩溃 时 ,在 从 节点 
(备份 节点 ) 上 配置 一 个 新 的 组 件 实例 。 

2 中 心 管理 服务 

中 心 管理 服务 为 多 源 信息 协同 总 体 架构 提供 管理 协同 信息 、 监 控 协 同 
状态 的 集成 服务 ,方便 对 信息 协同 总 体 运 行情 况 的 掌控 ,及 时 发 现 信 息 协同 
过 程 中 的 问题 ,准确 ,快速 地 定位 问题 原因 ,保证 信息 协同 流程 的 正常 与 稳 
定 。 其 主要 功能 包括 信息 协同 的 流程 管理 服务 管理 .目录 管理 .日 志 管 理 、 
监控 管理 ,审计 管理 ,权限 管理 ,字典 管理 等 。 

(1) 多 源 信息 协同 流程 管理 : 一 是 信息 协同 的 技术 流程 管理 ,提供 信息 
协同 技术 流程 的 配置 .监控 和 管理 服务 ,其 中 监控 服务 主要 包括 对 信息 协同 
流程 运行 状态 的 信息 记录 信息 查看 、 故 障 和 报警 提示 等 ,管理 服务 主要 包 
括 信息 协同 流程 信息 (流程 名 称 、 运 行 状态 、 发 送 方 .接收 方 等 ) 的 注册 、 启 
Bh ,修改 \ 停 止 \ 注 销 等 ;二 是 信息 协同 的 业务 流程 管理 ,提供 信息 协同 业务 
流程 及 其 与 技术 流程 关联 关系 的 管理 。 

(2) 多 源 信息 协同 服务 管理 : 提供 Web 服务 JMS 服务 .REST 服务 等 
服务 内 容 ( 服 务 地 址 、 分 类 、 状 态 等 ) 的 注册 和 管理 。 

(3) 多 源 信息 协同 目录 管理 : 提供 对 协同 信息 的 目录 管理 和 元 数据 
描述 。 

(4) 多 源 信息 协同 日 志 管理 : 提供 信息 协同 流程 的 运行 日 志和 数据 交 
换 日 志 等 信息 的 管理 。 其 中 ,运行 日 志 包括 流程 交换 日 志 、 节 点 日 志 ( 节 点 
名 称 、 节 点 代码 节点 状态 、 启 停 时 间 )、 技 术 流程 日 志 ( 流 程 名 称 、 流 程 代码 、 
流程 状态 、 启 停 时 间 )、 业 务 流程 日 志 、 业 务 数据 跟踪 日 志 ( 业 务 数据 在 某 一 
业务 流程 内 的 流向 及 最 终 位 置 ) 、 报 警 日 志 等 ;数据 交换 日 志 包 括 各 类 数据 
的 历史 交换 情况 和 交换 轨迹 。 

O) 多 源 信息 协同 监控 管理 : 提供 管理 中 心 、 信 息 协 同 节点 、 信 息 协 同 
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流程 和 服务 组 件 运行 情况 监控 和 管理 ,并 根据 监控 结果 进行 多 维 统计 分 析 。 

(6) 多 源 信息 协同 审计 管理 : 提供 对 审计 内 容 的 规则 定制 和 配置 ,基于 
需求 进行 审计 。 

(7) 多 源 信息 协同 权限 管理 : 提供 对 信息 协同 总 体 架 构 中 的 用 户 、 权 
BR .角色 等 的 定义 .授权 和 管理 。 

(8) 信息 协同 字典 管理 : 提供 对 信息 协同 相关 各 类 信息 的 定义 和 管理 。 

3 数据 应 用 集成 

数据 应 用 集成 服务 运行 在 业务 (领域 ) 中 心 和 信息 协同 节点 端 ,与 中 心 
服务 总 线 和 中 心 管理 服务 进行 对 接 和 实时 交互 ,在 不 改变 信息 协同 节点 原 
有 业务 流程 的 前 提 下 ,与 中 心 端 共 同 完成 信息 协同 的 流程 配置 (流程 设计 、 
接口 设置 .参数 配置 ,流程 部 署 等 ) ,流程 管理 (流程 启 停 、 流 程 监控 等 ) 和 数 
据 处 理 (数据 适 配 ,数据 转换 .数据 加 密 / 解 密 、 数 据 整合 ,数据 加 工 等 ) 工 作 。 

4 配置 和 管理 

配置 和 管理 功能 主要 包括 信息 协同 流程 与 中 心服 务 总 线 的 对 接 ( 访 问 
保存 的 进程 和 和 运行 的 流程 ) 和 数据 映射 (定义 事件 流程 中 的 数据 转换 )、 服 务 
和 安全 管理 .事件 管理 (查看 正在 执行 的 事件 流程 运行 信息 ) .部 署 管理 ( 运 
行 部 署 规则 来 控制 组 件 的 开发 和 执行 )、 网 络 管理 等 。 

5 高 可 用 性 设计 

对 复杂 巨 系统 而 言 , 要 满足 业务 实时 性 和 不 间断 性 上 的 需求 ,就 需要 信 
息 协 同 总 体 架构 在 消息 、 中 心服 务 和 节点 服务 三 个 级 别 上 具备 大 数据 量 下 
的 高 可 用 性 (High Availability, HA)。 信 息 协 同 总 体 架构 建立 在 主 代理 服 
务 (Active) 和 从 代理 服务 (Passive) 的 基础 上 ,通过 反 向 通道 同步 和 容错 服务 
连接 , 主 从 服务 之 间 通 过 独立 的 HA 通道 实时 同步 ,如 图 6. 3 所 示 。 

后 台 通 道 同步 的 核心 是 主 服务 将 其 存储 的 数据 和 状态 复制 到 从 服务 
中 ,保持 了 主 从 服务 的 同步 。 同 步 通 道 专用 于 同步 代理 状态 和 消息 数据 的 
专 有 网 络 。 主 从 服务 使 用 同步 通道 实时 监测 其 他 服务 的 数据 流程 和 连接 ， 


图 6.3 主 从 服务 间 的 HA 通道 同步 


当 次 服务 作为 热 备 作用 时 不 接受 节点 连接 ,但 是 一 旦 其 探测 出 主 服务 不 可 
用 则 即时 切换 为 主 服务 状态 ,所 有 主 服 务 中 的 流程 和 数据 同步 切换 到 对 应 
的 从 服务 上 。 以 动态 作用 的 从 服务 对 同步 通道 的 重新 建立 ( 主 服务 恢复 ) 进 
行 实时 监测 ,一 旦 主 服 务 启动 , 则 实时 切换 到 从 服务 状态 。 

中 心服 务 和 节点 服务 的 高 可 用 性 架构 重点 在 于 主 从 服务 间 的 故障 切换 
配置 ( 见 图 6. 4)。 


中 心 管理 (HA 模式 ) 
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中 心 节点 管理 (HA 模式 ) 


图 6.4 中 心服 务 和 节点 服务 的 HA 架构 
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63 数据 分 布 和 接口 架构 


631 数据 分 布 架 构 


多 源 信息 协同 的 数据 分 布 架构 如 图 6. 5 所 示 ,其 中 信息 均 为 信息 协同 流 
程 的 运行 信息 ,不 包括 业务 数据 的 描述 。 


信息 协同 节点 信息 协同 业务 中 心 


a 


图 6.5 多 源 信息 协同 的 数据 分 布 架构 


1. 信息 协同 节点 的 信息 

在 信息 协同 节点 上 主要 包括 三 类 信息 。 

(1) 运行 日 志 信息 : 指 信息 协同 节点 管理 器 .信息 协同 中 间 件 运行 记录 
的 日 志 信息 。 

(2) 事件 日 志 信息 : 对 于 发 生 的 需要 被 管理 监控 的 系统 行为 进行 记录 ， 
形成 本 地 的 事件 日 志 ,事件 在 发 生 时 即时 通知 管理 中 心 的 事件 管理 服务 。 

G) 交换 日 志 信 息 : 在 数据 处 理 流程 运行 过 程 中 ,对 数据 交换 的 情况 的 
记录 。 

2 信息 协同 业务 中 心 的 信息 

在 信息 协同 业务 中 心 主要 包括 五 类 信息 。 


(1) 运行 日 志 信 息 : 采用 直接 连接 到 信息 协同 节点 提供 的 Web 日 志 浏 
览 的 方式 。 

(2) 事件 日 志 : 与 信息 协同 节点 上 的 时 间 日 志 信 息 保持 同步 。 

(3) 交换 日 志 信 息 : 与 信息 协同 节点 上 的 时 间 日 志 信 息 保持 同步 。 

(4) 操作 日 志 信 息 : 根据 审计 策略 定义 ,对 通过 信息 协同 业务 中 心 进行 
管理 操作 的 记录 ,提供 查询 统计 功能 。 

(5) 业务 域 基本 信息 : 实现 和 管理 中 心 的 基本 信息 的 同步 ,实现 信息 协 
同业 务 中 心 在 管理 中 心 无 法 联通 情况 下 的 独立 运行 ,主要 包括 用 户 信息 ( 基 
本 信息 .角色 信息 .授权 信 息 等 ) .注册 信息 (业务 注册 信息 .节点 注册 信息 )、 
审计 策略 定义 信息 等 。 

3 管理 中 心 的 信息 

在 管理 中 心 主要 包括 五 类 信息 : 

d) 交换 日 志 信息 : 对 来 自 于 各 信息 协同 节点 交换 日 志 信息 ,按照 统一 
的 数据 要 求 标准 进行 汇总 并 提供 查询 和 统计 服务 。 

(2) 事件 日 志 信息 : 接收 来 自信 息 协同 节点 的 节点 管理 器 、 信 息 协同 中 
间 件 运行 过 程 中 各 类 事件 信息 的 汇总 ,这 些 事 件 发 生 后 需 及 时 通知 管理 中 
心 的 事件 通知 服务 ,由 事件 管理 服务 处 理 并 保存 ,包括 异常 事件 类 型 .节点 
号 .异常 事件 描述 .异常 处 理 办 法 .异常 节点 是 否 已 短信 等 方式 通知 ` 异 常 发 
生 时 间 等 。 

(3) 监控 日 志 信 息 : 管理 中 心 监控 服务 采用 定时 轮 询 的 方式 对 信息 协 
同 总 体 情况 进行 监控 ,监控 日 志 是 对 每 次 监控 轮 询 中 ,每 个 被 监控 对 象 的 运 
行 状 态 的 客观 记录 。 

(4) 操作 日 志 信 息 : 根据 审计 策略 定义 ,对 通过 管理 中 心 进行 管理 操作 
的 记录 ,包括 操作 类 型 .操作 结果 、 操 作 人 、 操 作 人 机 器 IP 地 址 、 操 作 时 间 等 。 

O 基本 信息 : 包括 用 户 信息 ( 基 本 信息 、 角 色 信 息 ,授权 信息 ) 、 业 务 域 
注册 信息 (标识 支撑 业务 的 信息 )、 节 点 注册 信息 (标识 节点 、 节 点 管理 器 、 
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信息 协同 中 间 件 等 的 注册 信息 ) ,监控 策略 定义 信息 、 审 计策 略 定义 信息 等 。 
632 接口 设计 


在 多 源 信息 协同 的 用 户 接 口 设计 上 ,管理 中 心服 务 和 信息 协同 业务 中 
心服 务 采用 B/S 模式 ;数据 交换 的 建 模 及 配置 过 程 采 用 C/S 模式 ,提供 建 
模 、 部 署 及 管理 监控 功能 。 

多 源 信息 协同 的 功能 接口 的 设计 主要 包括 节点 远程 管理 接口 、 信 息 协 
同 流程 本 地 管理 接口 ,信息 协同 流程 远程 管理 接口 日 志 接 口 和 事件 接口 五 
类 ,具体 接口 和 功能 描述 如 表 6. 1 所 示 。 


Set UT BES + SSMS tS— AS R 


R61 多 源 信息 协同 的 功能 接口 


序号 | 接口 分 类 接口 名 称 功能 描述 
1 | 节点 远程 | 信息 协同 流程 启动 停止 管理 信息 协同 流程 的 启动 .停止 
”2 | 管理 接口 | 信息 协同 流程 状态 浏览 获取 信息 协同 流程 当前 的 运行 状态 
3 
4 


信息 协同 | 信息 协同 流程 启 、 停 接口 | 管理 信息 协同 流程 的 启动 .停止 
流程 本 地 | 信息 协同 流程 运行 状态 获取 | 获取 信息 协同 流程 当前 的 运行 状态 
管理 接口 | 信息 协同 节点 运行 情况 获取 | 获取 节点 的 CPU\、 内 存 等 运行 情况 


5 
6 | 数据 处 理 流程 查询 接口 支持 全 部 及 带 条 件 的 流程 查询 
7 | 数据 处 理 流程 调度 配置 接口 | 对 数据 流程 的 调度 
| 数据 处 理 流程 属性 读 、 写 接口 | 对 数据 处 理 流程 的 属性 读 取 和 修改 
9 数据 处 理 流程 运行 状态 读 取 | 获取 数据 处 理 流程 的 运行 状态 
“10 | | 连接 器 查询 接口 支持 全 部 及 带 条 件 的 查询 
EE | eae ae ik SED 对 连接 属性 读 取 和 修改 
_12 | 管理 接口 | 传输 通道 (监听 服务 ) 查 询 ”| 对 数据 传输 /监听 服务 的 查询 
13 | 传输 通道 配置 读 取 接 口 读 取 传输 通道 的 配置 信息 
14 传输 通道 配置 修改 接口 修改 传输 通道 的 配置 信息 
“45 | IMS 传输 队列 增 、 删 、 改 接口 | 实现 对 JMS 队列 的 动态 配置 
“16 | IMS 队列 消息 监控 接口 BEIR IMS 队列 中 待 处 理 的 消息 数量 
“47 | 监听 服务 器 启 、 停 接口 对 HTTP/s, Web Service 等 方式 的 启 停 
4 laced (es dl 


在 管理 中 心 提供 事件 监听 服务 和 端点 


=| 19 | SHEE | Stead 认证 机 制 ,实现 全 网 事件 记录 
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多 源 信息 协同 网 络 的 测度 与 优化 


协同 主体 差异 和 协同 主体 关系 是 反映 一 个 协同 网 络 内 生 结 | 
构 的 两 个 必要 元 素 ,二 者 相辅相成 ,共同 对 网 络 的 内 部 世界 进行 
画像 。 差 异 测度 利用 信息 组 织 的 “属性 变量 ", 体 现 协同 结构 中 
信息 组 织 的 特征 相似 程度 。 关 系 测度 利用 信息 组 织 间 的 “关系 | 
变量 ", 体 现 协同 网 络 中 存在 的 凝聚 子 群 及 其 相互 关系 。 


SHU BES HS Ssh tS— AS R 
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第 7 章 ”基于 模糊 聚 类 的 协同 网 络 差异 测度 


不 同 主体 间 的 多 源 信息 协 同 是 一 个 复杂 巨 系统 正常 运转 的 前 提 。 传 统 
的 城市 系统 下 的 多 源 信息 协同 模式 以 中 心 管理 模式 为 主 ,协同 结构 相对 单 
一 ,在 智慧 城市 复杂 巨 系统 的 应 用 中 ,协同 效率 比较 低下 。 近 年 来 , 随 着 4G、 
移动 智能 终端 , 物 联 网 等 新 一 代 信息 技术 应 用 的 爆发 式 发 展 , 对 汇聚 多 源 信 
息 的 城市 大 数据 应 用 提出 了 更 高 的 要 求 , 这 也 进一步 加 剧 了 信息 协同 效率 
提升 与 协同 结构 相对 单一 的 矛盾 。 如 何 对 智慧 城市 的 多 源 信息 协同 网 络 进 
行 科 学 测度 ,并 在 此 基础 上 对 协同 模式 进行 合理 优化 ,已 成 为 制约 智慧 城市 
深化 发 展 的 关键 科学 问题 。 

目前 ,对 智慧 城市 多 源 信息 协同 网 络 的 测度 主要 集中 在 总 体 层 面 ,如 协 
同 主体 的 规模 和 覆盖 率 \ 信 息 编目 和 信息 共享 的 数量 等 ,缺少 对 内 生 结 构 的 
测度 。 在 本 章 和 下 章 中 ,分 别 对 两 种 维度 的 结构 测度 方法 及 相应 优化 策略 
进行 介绍 。 

一 是 对 协同 主体 的 差异 测度 及 横向 优化 。 聚 类 分 析 根 据 对 象 的 特征 
(属性 ) 大 小 分 类 ,体现 了 对 象 个 体 特征 (属性 ) 的 相似 程度 。 针 对 信息 组 织 
和 信息 领域 的 交叉 性 和 关联 性 特征 ,模糊 聚 类 在 特征 相似 度 分 析 的 同时 可 
以 给 出 置信 度 区 间 ,是 研究 复杂 巨 系统 下 多 源 信息 协同 网 络 的 有 效 方法 。 

二 是 对 协同 主体 间 的 关系 测度 及 纵向 优化 。 以 聚 类 算法 为 基础 的 凝聚 
子 群 分 析 属 于 社会 网 络 分 析 范 畴 ,也 是 研究 结构 问题 的 主要 方法 之 一 。 凝 
聚 子 群 根据 对 象 之 间 的 相互 关系 分 类 ,体现 了 对 象 间 的 关联 关系 ,是 对 网 络 
进行 多 层次 结构 分 析 的 主要 方法 。 


71 硬 聚 类 与 模糊 聚 类 


711 聚 类 分 析 的 基本 概念 与 方法 


“ 物 以 类 聚 ,人 以 群 分 ”, 这 句 话 最 恰当 地 描述 了 聚 类 分 析 的 目的 。 对 小 
数据 量 的 数据 进行 分 类 处 理 时 ,比如 个 位 数 的 数据 ,可 以 手工 对 数据 进行 分 
类 ,但 是 当 数据 量变 大 时 手工 分 析 处 理 每 个 对 象 就 变 得 不 切实 际 。 聚 类 分 
析 的 实质 是 建立 一 种 预先 未 知 的 对 样本 或 变量 进行 分 类 的 技术 ,对 样本 (对 
象 ) 的 聚 类 称 为 Q 型 聚 类 ,对 变量 的 聚 类 称 为 R 型 聚 类 。 一 般 情 况 下 ,主要 
是 对 样本 进行 聚 类 ,从 而 在 没有 先 验 知识 的 情况 下 将 样本 自动 分 类 。 

聚 类 分 析 可 以 看 作 是 一 种 无 教师 的 模式 分 类 方法 ,在 分 类 时 只 依赖 对 
象 自身 所 具有 的 属性 来 区 分 对 象 之 间 的 相似 程度 。 当 前 聚 类 分 析 算 法 的 研 
究 中 也 有 一 些 有 学 习 过 程 的 聚 类 算法 ,如 半 监 督 \ 有 监督 的 聚 类 算法 ,但 通 
常情 况 下 聚 类 分 析 算法 都 不 需要 提供 预先 已 知 类 别 信息 的 样本 来 训练 分 类 
器 。 聚 类 分 析 算法 作为 一 种 有 效 的 数据 分 析 方 法 被 广泛 应 用 于 数据 挖掘、 
机 器 学 习 、 图 像 分 割 .语音 识别 .生物 信息 处 理 、. 商 业 分 析 等 领域 ; 聚 类 算法 
还 可 以 应 用 于 商业 分 析 , 它 可 以 帮助 市 场 决策 人 员 从 消费 者 数据 库 中 区 分 
出 不 同 的 消费 群体 ,并 且 概 括 出 每 一 类 消费 者 的 消费 模式 或 习惯 。 从 本 质 
来 说 聚 类 算法 是 将 总 体 中 的 个 体 分 类 以 发 现 数据 中 的 结构 ,希望 一 个 类 中 
的 个 体 彼此 接近 或 相似 ,而 与 其 他 类 中 的 个 体 相 异 ,这 样 就 可 以 对 划分 出 来 
的 每 一 类 进行 深入 分 析 从 而 概括 出 每 一 类 的 特点 。 

目前 , 聚 类 算法 主要 分 为 层次 化 聚 类 方法 .划分 式 聚 类 方法 .基于 密度 
的 聚 类 方法 、 基 于 网 格 的 聚 类 方法 、 基 于 核 的 聚 类 算法 、 基 于 谱 的 聚 类 方法 、 
基于 模型 的 聚 类 方法 、 基 于 遗传 算法 的 聚 类 方法 .基于 SVM 的 聚 类 方法 、 基 
于 神经 网 络 的 聚 类 方法 等 。 
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1. 聚 类 算法 的 基本 定义 

给 定 一 个 对 象 集合 X= {zi ,zs，… ,zx,) ,假设 每 个 对 象 x, (i 二 1,2,…,n) 
含有 mm 个 特征 ,在 此 用 向 量 的 方式 来 表示 对 象 的 特征 ,x Cha ,1 ,… ln) o R 
类 分 析 的 过 程 就 是 根据 对 象 的 特征 来 分 析 对 象 之 间 的 相似 程度 ,并 根据 某 
种 聚 类 决策 准则 来 获得 聚 类 结果 。 聚 类 的 结果 用 C=={c ,cs ,… ,ci) 表 示 , 则 
聚 类 结果 满足 以 下 条 件 : 

(1) FD ,i=1, sk; 

(2) Ua=X: 

(3) co =D ,zj,i,j=1,.,k。 

模糊 聚 类 的 结果 没有 上 面 的 约束 条 件 , 模 糊 聚 类 给 出 的 结果 只 是 对 象 
隶属 于 每 个 类 的 程度 。 通 常 聚 类 分 析 算 法 一 般 包含 四 个 部 分 : 四 特征 获取 
与 选择 ; @ 计 算 相似 度 ; OFA: @ 聚 类 结果 展示 。 

2 距离 和 相似 系数 

在 聚 类 分 析 中 ,用 距离 描述 对 象 间 的 靠近 程度 ,用 相似 系数 描述 变量 间 
的 联系 紧密 程度 ,距离 和 相似 系数 可 以 相互 转换 。 因 为 不 同 的 相似 性 指标 
所 测量 的 相似 程度 的 意义 有 所 区 别 , 因 此 选用 不 同 的 距离 或 相似 系数 ,可 能 
会 得 到 不 同 的 分 类 结果 。 

距离 测度 方法 主要 有 欧 几 里 得 距离 (Euclidean Distance)、 明 可 夫 斯 基 
距离 (Minkowski Distance) , 曼哈顿 距离 (Manhattan Distance). YW tk KEE 
E (Chebyshev Distance) ` 马 哈 拉 诺 比 斯 距离 (Mahalanobis Distance) 等 ; 相 
似 度 测度 方法 主要 有 向 量 的 夹 角 余弦 (Cosine Similarity) 、 皮 尔 森 相关 系数 
(Pearson Correlation Coefficient) , Jaccard 相似 系数 (Jaccard Coefficient) 
SE WER PS Fa Sic FA IL AS E RS E HE Vn] Ta A KE ffi AR A BL AS A ADE BE 
HE ,很 多 距离 度量 和 相似 度 度量 都 是 基于 这 两 者 的 变形 和 衍生 。 

距离 度量 衡量 的 是 空间 各 点 间 的 绝对 距离 .与 各 个 点 所 在 的 位 置 坐标 
( 即 个 体 特征 维度 的 数值 ) 直 接 相 关 , 体 现 个 体 数 值 特征 的 绝对 差异 ,主要 用 


于 需要 从 维度 的 数值 大 小 中 体现 差异 的 分 析 , 如 使 用 用 户 行 为 指标 分 析 用 
户 价 值 的 相似 度 或 差异 。 向 量 的 夹 角 余弦 衡量 的 是 空间 向 量 的 夹 角 , 更 多 
的 是 体现 在 方向 上 的 差异 ,而 不 是 位 置 ,对 绝对 的 数值 不 敏感 ,主要 用 于 使 
用 用 户 对 内 容 的 评分 来 区 分 用 户 兴趣 的 相似 度 和 差异 ,同时 修正 了 用 户 间 
可 能 存在 的 度量 标准 不 统一 的 问题 。 

除 以 上 所 列 出 的 常见 距离 函数 和 相似 系数 外 ,还 有 一 些 专门 用 于 测量 
离散 值 向 量 的 距离 函数 ,混合 值 类 型 的 距离 函数 ,及 专门 用 于 模糊 集 的 距离 
函数 等 。 在 聚 类 分 析 中 还 涉及 两 种 类 型 的 距离 计算 : 一 是 类 间距 离 (Inter- 
cluster Distance) ,表示 两 个 类 之 间 的 差异 ;二 是 对 象 和 类 之 间 的 距离 ,表示 
对 象 和 一 个 类 之 间 的 差异 。 计 算 模式 之 间 相 似 程 度 的 研究 是 目前 模式 识别 
领域 的 一 个 重要 方向 。 比 较 有 代表 性 的 研究 有 马 氏 距离 函数 在 高 维 数据 空 
间 中 的 信息 丢失 问题 ,基于 分 布 模型 和 距离 函数 的 统计 分 析 找 到 最 好 距离 
来 估计 对 象 之 间 相似 度 的 通用 向 导 、 马 氏 类 型 数据 的 距离 函数 比较 、 生 物 序 
列 距离 的 快速 算法 、 无 序列 比 对 的 蛋白 质 序 列 距 离 估 计 方 法 、 用 于 计算 
SCOP 蛋白 质数 据 集 的 序列 距离 计算 方法 等 。 除 此 之 外 ,由 于 距离 函数 的 设 
计 和 聚 类 分 析 的 对 象 密 不 可 分 ,在 一 些 新 的 应 用 领域 出 现 了 一 些 新 的 或 改 
进 的 距离 计算 方式 ,如 基于 自 适 应 的 Hausdorff 距离 函数 的 动态 聚 类 算法 、 
基于 压缩 距离 的 蛋白 质 序列 分 类 算法 、 基 于 点 对 称 的 距离 测度 的 进化 聚 类 
算法 、 采 用 内 部 距离 分 类 形体 的 算法 、 通 过 类 间距 离 选 择 支持 向 量 机 的 参 

3. 主要 的 硬 聚 类 算法 

聚 类 是 数据 库 知 识 发 现 领域 的 重要 课题 。 目 前 聚 类 算法 主要 有 层次 聚 
类 方法 .划分 式 聚 类 方法 、 基 于 密度 的 聚 类 方法 .基于 网 格 的 聚 类 方法 、 基 于 
核 的 聚 类 算法 、 基 于 谱 的 聚 类 方法 、 基 于 模型 的 聚 类 方法 、 基 于 遗传 算法 的 
聚 类 方法 .基于 SVM 的 聚 类 方法 、 基 于 神经 网 络 的 聚 类 方法 等 ,各 种 方法 有 
不 同 的 基本 思想 。 
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1) 层次 聚 类 

层次 聚 类 算法 (Hierarchical Clustering) 又 称 为 树 聚 类 算法 或 系统 聚 类 
算法 ,是 最 常用 的 硬 聚 类 算法 之 一 , 按 自 底 向 上 层次 分 解 称 为 凝聚 法 
(agglomerative) 层 次 聚 类 , 按 自 顶 向 下 层次 分 解 称 为 分 裂 法 (divisive) 层 次 
聚 类 。 这 种 算法 的 基本 思路 是 首先 将 所 有 对 象 看 成 独立 的 个 体 类 ,通过 计 
算 类 间 的 距离 来 选择 最 小 距离 的 两 个 类 合并 成 一 个 新 类 ,再 重新 计算 新 类 
和 其 他 类 之 间 的 距离 ,选择 最 小 距离 的 两 个 类 合并 ,依次 迭代 合并 直到 没有 
合并 为 止 。 

层次 聚 类 过 程 中 按照 类 间距 离 计 算 方 式 的 不 同 主要 有 以 下 几 种 方法 : 

(1) 最 短 距离 法 (单一 连接 、 紧 邻 连接 ): 两 个 类 之 间 的 距离 定义 为 两 类 
中 元 素 之 间距 离 最 小 者 。 

(2) 最 长 距离 法 (完全 连接 、 最 远 紧邻 连接 ): 两 个 类 之 间 的 距离 定义 为 
两 类 中 元 素 之 间距 离 最 大 者 。 

(3) 中 间距 离 法 : 两 个 类 之 间 的 距离 定义 为 两 类 中 元 素 之 间 的 某 个 中 
间距 离 。 

(4) 重心 法 : 两 个 类 之 间 的 距离 定义 为 两 个 类 的 重心 间 的 距离 。 

(5) 类 平均 法 : 两 个 类 之 间 的 距离 (平方 ) 定 义 为 两 类 中 元 素 两 两 之 间 
的 平均 (平方 ) 距 离 。 

(6) 变 差 平 方 和 法 (WARD 法 ) : 与 方差 分 析 思想 类 似 。 在 分 类 过 程 中 ， 
使 类 内 元 素 间 的 变 差 平方 和 尽 可 能 小 ,而 类 与 类 之 间 的 变 差 平方 和 尽 可 
能 大 。 

如 果 聚 类 过 程 中 每 一 步 聚 类 时 的 距离 都 大 于 前 一 步 , 则 称 该 聚 类 方法 
是 单调 的 。 如 果 两 个 类 之 间 的 距离 基本 取 中 间 , 既 不 取 最 短 ( 空 间 收缩 ) ,也 
不 取 最 长 (空间 扩展 ), 则 称 该 聚 类 方法 空间 守恒 。 单 调 性 和 空间 守恒 都 是 
一 个 好 的 聚 类 方法 的 表现 。 以 上 六 种 主要 层次 聚 类 方法 的 综合 比较 如 表 7. 1 
所 示 。 


表 7.1 六 种 主要 层次 聚 类 方法 的 综合 比较 


方 法 空间 性 质 | 单调 性 距离 要 求 适用 形 结果 唯一 性 
最 短 距离 法 压缩 单调 无 条 形 、S 形 | 唯一 
最 长 距离 法 扩张 单调 无 
中 间距 离 法 守重 非 单调 aces prom at 
重心 法 守重 非 单调 HIERIE 可 能 出 现 不 
类 平均 法 守重 单调 无 唯一 的 结果 
变 差 平方 和 法 | ”扩张 单调 欧 氏 距离 的 平方 


目前 常用 的 层次 聚 类 算法 有 : CURE, ROCK 、BIRCH Chameleon 等 。 
层次 聚 类 算法 的 改进 算法 也 很 多 。Goldberger Jacob 提出 一 种 基于 
Hungarian 方法 的 层次 聚 类 方法 ,该 方法 的 输入 只 需要 样本 点 之 间 的 成 对 距 
离 即 可 。 经 典 Hungarian 方法 是 求解 最 小 加 权 环 覆盖 问题 的 有 效 方法 ,该 
方法 使 用 Hungarian 方法 来 构建 基本 的 聚 类 块 划分 。Loewenstein Yaniv 等 
改进 了 经 典 的 UPGMA 方法 ,用 于 进行 大 规模 的 蛋白 质 序 列 聚 类 分 析 。 算 
法 可 以 在 内 存 受 限 的 环境 下 进行 大 数据 量 的 聚 类 分 析 。Wang H. 等 采用 改 
进 的 层次 聚 类 算法 分 析 基 因 表达 序列 数据 ,Arifin Agus Zainal 等 采用 层次 
聚 类 算法 对 图 像 进 行 分 割 。 由 于 层次 聚 类 算法 适合 处 理 大 型 数据 集 , 因 此 
被 广泛 应 用 于 分 析 蛋 白质 序列 数据 。 

2) 划分 式 聚 类 

划分 式 聚 类 方法 的 主要 思想 是 : 对 于 一 个 给 定 的 nn 个 数据 对 象 的 数据 
集 ,采用 目标 函数 最 小 化 的 策略 ,初始 时 选择 一 定量 的 聚 类 中 心 或 数据 点 ， 
通过 某 种 原则 把 数据 划分 到 各 个 组 中 ,每 个 组 为 一 个 徐 。 最 典型 的 划分 式 
聚 类 算法 是 k-means 算法 和 k-medoids 算法 。 这 两 种 算法 的 改进 算法 非常 
多 ,应 用 也 很 广泛 。 

比较 有 代表 性 的 研究 有 : 针对 k-means 算法 只 能 保证 收敛 到 局 部 最 优 ， 
从 而 导致 聚 类 结果 对 初始 代表 点 的 选择 非常 敏感 的 问题 。 雷 小 锋 等 给 出 了 
一 种 叫做 K-MeanSCAN 的 算法 ,算法 采用 k-means 对 数据 进行 多 次 预 聚 
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H. 等 分 析 了 数据 集 本 身 的 分 布 与 k-means 算法 的 聚 类 结果 之 间 的 关系 ; 
Chung Kuo-Liang 等 给 出 了 一 种 基于 对 称 距离 测度 的 k-means 算法 ;Huang 
Joshua Zhexue 等 给 出 了 一 种 在 迭代 划分 过 程 中 自动 变换 变量 权 值 的 k- 
means 算法 ;Wu F. X 采 用 遗传 加 权 k-means 算法 来 分 析 基 因 表达 数据 ; 
Bagirov Adil M 提出 了 一 种 新 的 全 局 k-means 算法 ,算法 能 够 克服 k-means 
算法 对 初始 点 选择 敏感 的 问题 ;针对 k-means 算法 的 类 个 数 选择 的 问题 ， 
Hamerly G 等 讨论 了 如 何 从 聚 类 过 程 中 学 习 k 值 的 方法 ;Du 等 将 粒子 群 优 
化 方法 和 k-means 算法 结合 用 于 分 析 基 因 表 达 数 据 。 

3) 基于 密度 和 网 格 的 聚 类 

基于 密度 和 网 格 的 聚 类 算法 在 以 空间 信息 处 理 为 代表 的 众多 领域 有 着 
广泛 应 用 ,特别 是 随 着 大 规模 数据 集聚 类 的 需求 越 来 越 强烈 ,常规 的 聚 类 算 
法 在 大 规模 数据 集聚 类 分 析 时 受到 限制 ,因此 基于 密度 和 网 格 的 聚 类 方法 
在 空间 数据 挖掘 研究 领域 日 趋 活跃 。 具 有 代表 性 的 基于 密度 的 聚 类 算法 有 
DBSCAN .GDBSCAN OPTICS, DENCLUE, CLIQUE 等 。 基 于 网 格 的 聚 
类 算法 常常 与 其 他 方法 相 结 合 ,特别 是 与 基于 密度 的 聚 类 方法 相 结 合 。 
STING 是 代表 性 的 基于 网 格 的 聚 类 算法 。 

4) 其 他 聚 类 算法 

除了 以 上 描述 的 常见 聚 类 算法 外 ,目前 热点 研究 的 聚 类 算法 还 有 基于 
支持 向 量 机 的 聚 类 算法 、 基 于 核 方 法 的 聚 类 算法 、 基 于 神经 网 络 的 自 组 织 映 
射 CSOM) 算 法 、.K-NarestNeighbor(K-NN) 聚 类 算法 及 其 改进 算法 、 基 于 神 
经 气 的 聚 类 算法 . 谱 聚 类 算法 、 复 杂 网 络 聚 类 方法 等 。 目 前 ,关于 谱 聚 类 算 
法 的 研究 在 图 像 分 割 .不 规则 形状 聚 类 方面 有 很 好 的 效果 。 

上 面 给 出 的 聚 类 算法 绝 大 多 数 都 属于 无 监督 的 聚 类 算法 ,但 在 实际 分 
析 数 据 时 ,有 时 也 能 够 获得 一 部 分 数据 先 验 知识 ,例如 部 分 数据 的 正确 类 信 
息 或 数据 分 布 的 信息 等 。 利 用 这 些 先 验 知识 来 指导 聚 类 分 析 , 就 形成 了 有 
监督 或 半 监 督 的 聚 类 分 析 方 法 。Al-Harbi SH 等 给 出 了 一 种 有 监督 的 自 适 


应 的 k-means 算法 ,Staiano A 等 采用 有 监督 的 FCM 方法 来 改进 径 向 基 神 
经 网 络 的 性 能 。 利 用 少量 的 先 验 知识 来 对 大 量 没有 先 验 知识 的 数据 进行 聚 
类 分 析 是 半 监 督 聚 类 分 析 算 法 的 主要 目的 。 

聚 类 分 析 算 法 本 质 上 都 有 一 个 自己 的 分 类 标准 ,也 可 以 理解 为 对 数据 
分 组 的 目标 是 什么 ,用 数学 意义 上 的 概念 来 说 就 是 目标 函数 。 现 存 的 大 部 
分 聚 类 标准 或 是 目标 函数 可 以 归结 为 以 下 几 类 : 

(1) 以 紧密 性 为 目标 的 聚 类 分 析 , 即 复 内 对 象 联系 紧密 «RM ERLE 
代表 性 的 算法 有 划分 式 方法 中 的 k-means 算法 、 层 次 聚 类 算法 等 ,这 类 算法 
对 球形 分 布 的 数据 或 者 是 本 身 可 分 性 就 很 强 的 数据 有 很 好 的 聚 类 效果 ,但 
是 对 复杂 结构 的 数据 或 分 布 无 能 为 力 。 

(2) 以 连通 性 为 目标 的 聚 类 分 析 。 这 类 算法 的 基本 思路 是 相互 邻接 的 
数据 应 该 有 相同 的 模式 。 代 表 性 的 算法 有 基于 密度 的 聚 类 、 基 于 路 径 的 聚 

(3) 以 空间 隔离 为 标准 进行 聚 类 分 析 。 单 纯 以 空间 隔离 性 作为 标准 难 
以 获得 很 好 的 有 意义 的 聚 类 分 析 结 果 ,通常 和 其 他 标准 相 结合 。 
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前 面 介绍 的 聚 类 方法 可 以 看 成 是 硬 聚 类 (hard clustering) , 即 每 个 对 象 
属于 并 且 仅 仅 属 于 一 个 复 , 因 此 每 个 簇 之 间 没 有 交集 。 模 糊 聚 类 (fuzzy 
clustering) 和 硬 聚 类 不 同 , 它 采 用 一 个 隶属 函数 来 关联 对 象 和 簇 之 间 的 
关系 。 

一 般 的 模糊 聚 类 过 程 如 下 : 模糊 聚 类 算法 最 开始 先 初 始 化 构建 一 个 初 
步 的 划分 ,将 数据 划分 为 K 个 模糊 组 ,构建 一 个 隶属 矩阵 品 。 通 过 隶属 矩阵 
求解 每 个 模糊 组 的 中 心 点 ,根据 计算 出 的 中 心 点 来 获得 当前 划分 的 目标 函 
数值 。 将 当前 获得 的 目标 函数 值 与 上 一 次 获得 的 目标 函数 值 进行 比较 ,如 
果 满 足 截 止 条 件 则 终止 算法 ,否则 更 新 隶属 矩阵 也 ,重复 以 上 步骤 。 

Baraldi A. 等 综述 了 模糊 聚 类 算法 ,上 面 描述 的 模糊 聚 类 过 程 即 为 
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Fuzzy Mean(FCM) 算 法 。 该 算法 1974 年 由 Bezdek JC 提出 。FCM 是 目前 
应 用 广泛 的 模糊 聚 类 算法 之 一 ,收敛 速度 快 ,局 部 搜索 能 力 强 ,但 对 初 值 和 
噪声 较为 敏感 ,容易 陷入 局 部 最 优 ,而 得 不 到 全 局 最 优 解 。 局 部 最 优 的 问题 
一 直 都 是 困扰 聚 类 算法 的 一 个 难题 。 在 FCM 算法 的 基础 上 ,很 多 学 者 提出 
了 一 些 改进 的 算法 ,这 些 改进 集中 在 隶属 函数 设计 、 加 速 聚 类 过 程 、 避 人 免 陷 
入 局 部 最 优等 方面 。 由 于 原始 的 FCM 算法 是 基于 欧式 距离 的 , 即 要 求 数据 
空间 为 球形 空间 ,不 能 处 理 椭 圆 形 的 数据 空间 ,王丽娟 等 针对 这 一 问题 提出 
了 一 种 给 每 个 特征 属性 加 权 的 模糊 聚 类 算法 (CF-WFCM 算法 )。 由 前 面 
FCM 算法 过 程 的 描述 可 知 ,在 迭代 计算 的 过 程 中 要 存储 计算 整个 隶属 矩阵 
U, 并 且 要 不 断 更 新 计算 中 心 点 ,因此 FCM 算法 的 计算 复杂 度 较 高 ,难以 用 
于 大 型 数据 集 。Hathaway Richard J. 等 给 出 了 一 个 扩展 快速 FCM 算法 
geFFCM。 同 样 为 了 加 速 FCM 算法 的 运行 效率 ,Kolen JF 等 将 原始 的 FCM 
中 的 交替 更 新 隶属 矩阵 中 耗费 内 存 空间 的 过 程 移 除 ,将 两 步 更 新 合并 为 一 
步 更 新 ,显著 加 快 了 聚 类 运行 效率 。 由 于 FCM 可 能 过 度 划 分 数据 集 ， 
Laskaris Nikolaos A. 等 给 出 了 一 种 Beyond FCM 的 算法 ,该 算法 增加 了 一 
个 基于 图 的 后 处 理 阶段 。Pal NR 等 给 出 了 一 个 中 概率 模糊 C 均值 算法 。 
Dembele D. 等 采用 FCM 对 DNA 微 阵列 数据 进行 聚 类 分 析 ; Masson Marie- 
Hélène 等 提出 了 一 种 用 于 对 象 数据 聚 类 的 算法 ECM, 

近年 来 ,许多 学 者 将 智能 化 研究 引入 模糊 聚 类 算法 。 董 世 龙 等 提出 了 
一 种 基于 多 线程 的 云 资 源 模糊 聚 类 划分 并 发 算法 ,通过 传递 闭 包 法 进行 优 
化 解决 高 维和 矩阵 运算 问题 ,并 将 其 应 用 于 Hadoop 调度 器 的 策略 改进 ; 李 文 
娟 等 和 Sun Da-wei 等 提出 了 能 够 自 适应 选择 的 模糊 聚 类 资源 调度 和 分 配 算 
法 ; 王 洪 斌 等 针对 模糊 建 模 在 进行 结构 辨识 时 需 事先 设 定 聚 类 数 的 问题 , 提 
出 参数 自 适应 模糊 聚 类 算法 ;Zhu L 等 通过 引入 隶属 度 约束 函数 ,提出 一 种 
改进 模糊 分 割 的 聚 类 算法 (IFP-FCM) ,对 噪声 和 例外 点 具有 更 好 的 鲁 棒 性 ; 
Li Y 等 给 出 了 一 种 聚 类 数 c 自 适应 函数 ,自动 给 出 最 佳 的 聚 类 数 c 及 相应 
划分 隶属 矩阵 和 聚 类 中 心 .从 而 得 到 模糊 辨识 的 前 件 结构 和 参数 , 即 描述 系 


统 的 模糊 规则 和 隶属 度 函 数 。 随 着 群 智能 优化 算法 的 发 展 , 蚁 群 算法 、 微 粒 
群 算法 . 董 火 虫 算法 等 被 引入 到 模糊 聚 类 的 过 程 中 ,来 优化 全 局 寻 优 能 力 和 
快速 收敛 能 力 。 

除 此 之 外 ,还 有 一 些 其 他 的 模糊 聚 类 算法 。 例 如 Lee Sang Wan 等 给 出 
的 迭代 贝 叶 斯 模糊 聚 类 (Iterative Bayesian Fuzzy Clustering) ,Gan G. 等 给 
出 的 模糊 子 空间 聚 类 (Fuzzy Subspace Clustering, FSC), Gath I 等 结合 
FCM 和 最 大 期 望 估计 使 算法 能 够 有 效 分 析 簇 间 对 象 个 数 、 密 度 、 形 状 变化 较 
大 的 情况 ,Grira Nizar 等 提出 一 种 活跃 半 监 督 模 糊 聚 类 算法 ,以 及 模糊 自 组 
织 映射 聚 类 算法 、 炉 指数 约束 的 模糊 聚 类 等 。 


72 基于 模糊 聚 类 的 多 源 信息 协同 差异 测度 模型 


721 相关 定义 和 定理 


定义 1 模糊 相似 矩阵 : RWE REX 上 各 元 素 之 间 的 模糊 关系 ， 
且 满 足 : HEHE: RCz,z)=1,@ 对 称 性 : R(z,y) = 二 RC(y,x); 则 称 模糊 
KAR EX 上 的 一 个 模糊 相似 关系 。 当 论 域 X= {x ,zs，… ,zx,) 为 有 限时 ， 
XX 上 的 一 个 模糊 相似 关系 R 就 是 模糊 相似 矩阵 , 即 尺 满足 : OA RE I 过 
R(Sr,=1) ,四 对称 性 : RT=R(OS ry =rj) 。 

定义 2 REMER: 当头 二 {xi ,zs，…,x,) 为 有 限 论 域 时 ,X 上 的 
模糊 等 价 关系 R 是 一 个 矩阵 ( 称 为 模糊 等 价 和 矩阵 ) 。 它 满足 三 个 条 件 : OF 
反 性 : 产 一 1 ,四 对 称 性 : ry =ri OMAHE: Re*RCR; 即 V Cra Ary) Kra vis 
和 

定义 3 模糊 矩阵 的 1- 截 矩阵 : E AS (Cay) xy WHER AC (0.1). KH 
A= aa) xy 为 模糊 矩阵 4 的 人- 截 矩阵 。 其 中 , 当 ag >A 时 ,as” 二 1; 当 
ag <A fay ® =0, BRA 的 入 截 矩 阵 为 布尔 矩阵 。 

通常 模糊 关系 不 一 定 具 有 传递 性 ,因此 不 是 模糊 等 价 关系 ,需要 通过 某 
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种 方法 对 模糊 关系 进行 改造 。 

定义 4 模糊 传递 闭 包 : 设 REg(XXX), 称 1(R) 为 R 的 传递 闭 包 。 如 
果 (RWB: DERE: ORD CR) DURE: RCR), ORE: 
G REX 上 的 模糊 传递 关系 ,上 且 RCR’>1(R)CR’, 即 R 的 传递 闭 包 1(R) 
是 包含 R 的 最 小 的 传递 关系 。 

定义 5 模糊 等 价 闭 包 : 设 REg(XXX), 称 e(R) 为 R 的 等 价 闭 包 , 如 
果 e(R) 满 足 : DEME: e(R) 是 XX 上 的 模糊 等 价 关 系 ,加 包容 性 : RCe 
CR) ,四 最 小 性 : 车 REX 上 的 模糊 等 价 关系 , 且 RCR’>e(R)CR’, w 
然 ,R 的 等 价 闭 包 是 包含 R 的 最 小 的 等 价 关 系 。 

定理 1 设 REFCXXX) 是 相似 关系 ( 即 尺 是 自 反 、 对 称 模糊 关系 ), 则 
e《(R) 二 +:(R), 即 模糊 相似 关系 的 传递 闭 包 就 是 它 的 等 价 闭 包 。 


7.22 信息 组 织 的 特征 分 析 


一 般 情况 下 ,信息 组 织 的 信息 协同 特征 分 为 基础 特征 和 扩展 特征 两 部 
分 。 基 础 特征 主要 包括 以 下 三 个 层面 : 

d) 信息 组 织 层面 : 信息 需求 方 数量 、 信 息 提供 方 数量 等 。 

(2) 信息 内 容 层面 : 提供 信息 的 情况 、 获 取信 息 的 情况 等 。 

(3) 信息 协同 多 样 性 层面 : 信息 载体 的 多 样 性 、 信 息 频 率 ( 周 期 ) 的 多 样 

对 于 有 较 大 相关 性 的 特征 可 合并 降 维 处 理 ,如 信息 的 关联 事件 和 应 用 
领域 与 信息 需求 方 合并 为 同类 因素 。 

扩展 特征 主要 包括 以 下 两 种 情况 : 

(1) 与 信息 协同 水 平 无 直接 相关 性 的 特征 : 如 所 属 管理 对 象 和 感知 设 
备 的 种 类 (或 数量 ) 。 

(2) 变化 性 强 .不 易 定量 的 特征 : 如 信息 协同 的 重要 性 与 具体 业务 、 事 
件 场景 .应急 态势 等 有 较 强 的 关联 关系 。 

扩展 特征 在 不 同 的 情景 下 是 反映 信息 组 织 的 重要 因素 ,可 根据 实际 情 


况 作为 基础 特征 的 补充 。 
723 信息 组 织 的 模糊 聚 类 模型 


1. 特征 提取 与 信息 协同 标准 纸 阵 构建 

RA n 个 信息 组 织 ( 对 象 ) ,每 个 信息 组 织 有 m 个 特征 (属性 )。 令 A= 
laisar ,as} 表 示 信 息 组 织 的 集合 ,zj (i 二 1,2,…,n;j 二 1,2,…,m) 表 示 第 
i 个 信息 组 织 的 第 j 个 特征 , 则 信息 协同 原始 矩阵 P RIRI 
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若 存 在 某 个 特征 (矩阵 己 中 的 某 列 ) ,各 信息 组 织 的 该 特征 值 相 差 极 大 ， 
或 由 于 某 种 特殊 原因 某 个 信息 组 织 的 特征 值 特别 突出 ,该 特征 在 聚 类 过 程 
中 的 作用 将 被 不 适当 地 夸大 。 因 此 ,为 了 避免 特殊 值 的 影响 ,首先 通过 公 
式 (7.1) 对 原始 数据 进行 预 处 理 : 


yy = 1.00— M+M (7.1) 


max = 
Tij Xj 


HH, z= IDe ME [0.5,0. 75]. 
i=l 


经 过 对 原始 数据 的 特殊 值 处 理 后 ,对 矩阵 己 进 行 标准 化 处 理 。 常 用 的 
方法 有 线性 变换 .平移 - 极 差 (标准 0-1) 变 换 、 平 移 - 标 准 差 变 换 、 最 优 值 为 给 
定 区 间 时 的 变换 .向 量规 范 化 等 ,可 根据 不 同情 况 选择 合适 的 方法 或 部 分 方 
法 的 组 合 。 

1) 线性 变换 

对 于 效益 型 的 属性 j: 


ys = (7.2) 
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对 于 成 本 型 的 属性 7: 


yg = 1-2 (7.3) 


2) 平移 - 极 差 (标准 0-1) EM 


对 于 效益 型 的 属性 j: 
ys 一 (7.4) 

对 于 成 本 型 的 属性 j: 
ys ae (7.5) 

3) 平移 -标准 差 变 换 
jo = USE el ey (7.6) 


Sh 


其 中 却 = 1 oe 1S ca 元 )。 
4) 最 优 值 为 给 定 区 间 时 的 变换 
对 于 既 非 效益 型 也 非 成 本 型 的 属性 j ,给 定 最 优 属性 区 间 [x? ,x) Je 
无 法 容忍 下 限 ,x 为 无 法 容忍 上 限 , 令 


1 一 (2 一 X20)/(3 一 X27) 车 x 过 zy 二 x 


1 着 人 和 

Yj 5 (7.7) 
1—(ay r7 )/ (aa) Ë D a> x 
0 其 他 


5) 向 量规 范 化 
无 论 成 本 型 还 是 效益 型 属性 , 均 可 进行 向 量规 范 化 : 


(7.8) 


与 其 他 几 种 变换 不 同 的 是 ,向 量规 范 化 后 从 属性 值 的 大 小 上 无 法 分 别 属性 
值 的 优 劣 ,各 对 象 的 同一 属性 值 的 平方 和 为 1, 常 用 于 计算 各 对 象 与 某 种 虚 


拟 对 象 ( 如 理想 点 或 负 理想 点 ) 的 欧式 距离 的 场合 。 
经 过 标准 化 处 理 后 ,得 到 信息 协同 标准 矩阵 


Ji， Yl? > Vim 

Yas Yaar s Yam 
Y= 

Iar Yms s Ym 


2 in A AR BM tate oR 

针对 标准 化 矩阵 ,计算 各 信息 组 织 间 的 相似 程度 ,建立 模糊 相似 矩阵 
R= 二 (rsj ),xm。 计 算 相似 程度 的 方法 主要 包括 距离 测度 和 相似 度 两 种 类 型 。 
其 中 ,距离 测度 越 大 ,说 明 对 象 间 相 似 度 越 小 ,差异 越 大 ;与 距离 测度 相反 ， 
相似 系数 越 小 ,说 明 对 象 间 相似 度 越 小 ,差异 越 大 。 距 离 测 度 d 与 相似 度 测 
BE r 之 间 可 以 通过 公式 (7.9) 进 行 转换 : 

ry =1—c e dlyisy;) (7.9) 

其 中 。 为 适当 选取 的 参数 。 

1) 距离 测度 

A) 欧 几 里 得 距离 (Euclidean Distance); 基于 各 维度 特征 的 绝对 数值 ， 
需要 保证 各 维度 指标 在 相同 的 刻度 级 别 。 


do) = | >) Ga — ya)? (7.10) 
k=1 


(2) 明 可 夫 斯 基 距 离 (Minkowski Distance); 明 氏 距离 是 欧 氏 距离 的 推 
广 , 是 对 多 个 距离 度量 公式 的 概括 性 的 表述 。 明 氏 距 离 中 p=2 时 得 到 的 距 
离 度量 即 为 欧式 距离 。 
yd | ya — yin |2" (7.11) 
(3) 曼哈顿 距离 (Manhattan 让 明 氏 距离 中 p= 1 时 得 到 的 距 
离 度量 。 


d(yi59) = lye — ya (7,12) 
i=l 
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(4) 切 比 雪夫 距离 (Chebyshev Distance): 当 p 趋向 于 无 穷 大 时 的 明 氏 
距离 。 


dlyisy;) = lim (>? | vie Dik |r)” max| y: yl (7.13) 
p> ` k=l 
(5) 马 哈 拉 诺 比 斯 距离 (Mahalanobis Distance): 基于 各 指标 维度 进行 
标准 化 后 再 使 用 欧 氏 距离 。 


d(yi+9)) = my D Oi — y) (7.14) 
2) 相似 系数 
(1) 向 量 的 夹 角 余 弦 (Cosine Similarity) : 


= (7. 15) 


= 
(2) EAR AR AR KE AK BW ( Pearson Correlation Coefficient) : 


D lye — Fil lye — | 


2 ist (7. 16) 
D (ya -F)) >) Gy yi) 
k=1 k=1 
z- 15, = Us 
其 中 ,y; = 加 J; mn Dah 


(3)Jaccard 相似 系数 (Jaccard Coefficient); 主要 用 于 计算 符号 度量 或 
布尔 值 度量 的 个 体 间 的 相似 度 ,无 法 衡量 差异 具体 值 的 大 小 ,只 关心 个 体 间 
共同 具有 的 特征 是 否 一 致 这 个 问题 。 


XNY 


Jaccard(X,Y) = XUY 


(7.17) 


3 OS Dae tT 
4 XYZ 为 有 限 论 域 时 , 即 X= (ay reset san} Y= {are ya yn)， 
Z= (21200 621) sll OR S(=O°R)HI A RAH EMER 
ONG Rage SS ts 


其 中 sa =V, (gs A ra) 8 PARE O SR 的 乘积 。 

当 论 域 为 有 限 集 时 , 求 相 似 关系 的 等 价 闭 包 即 对 相似 矩阵 R, 求 R?， 
R',…。 当 R**R* 一 R* 时 ,有 e(R)=1(R)=R*. 

依次 取 XE[0,1], 截 关系 R 是 经 典 等 价 关 系 , 它 诱 导出 X 上 的 一 个 划 
分 X/R,, 当 4 从 1 下 降 到 0 时 ,就 得 到 一 个 划分 族 。 由 于 a 这 B 时 ,R[xj]C 
Rel] BR, 给 出 的 分 类 结果 中 的 每 类 是 Re 给 出 的 分 类 结果 的 子 类 。 随 着 
A 的 下 降 ,R; 给 出 的 分 类 由 细 到 粗 ,形成 一 个 动态 的 聚 类 图 。 

通过 模糊 聚 类 算法 对 信息 组 织 进 行 智 能 聚 类 , 主要 应 用 在 两 个 方面 : 一 
是 在 给 定 置 信 度 的 前 提 下 (如 A> 90% ) ,通过 模糊 聚 类 过 程 可 以 智能 得 出 最 
合理 的 分 类 数量 ;二 是 在 给 定 信息 组 织 聚 类 数量 的 前 提 下 (如 将 某 市 的 信息 
组 织 按照 差异 程度 分 成 5 类 ) ,可 以 同步 给 出 该 结果 的 可 信 程 度 (A) 。 

本 书 附录 D 中 给 出 了 基于 MATLAB 的 模糊 聚 类 核心 计算 程序 ,包括 
数据 标准 化 变换 ,模糊 相似 和 矩阵 R 的 建立 矩阵 的 合成 运算 和 动态 聚 类 四 个 
关键 环节 。 


724 给 定 置信 区 间 的 信息 协同 系数 及 其 修正 形式 


设 定 模糊 聚 类 置信 区 间 ( 对 象 隶 属 程度 ) 的 下 限 值 M。 取 4 三 M, 根 据 模 
糊 聚 类 的 结果 将 个 信息 组 织 分 为 N, 类 。 
对 kE[1,2,… ,Nij, 设 第 类 组 织 的 集合 为 Oi, 第 & 类 组 织 的 信息 协 
同 度 为 
a= D (Sys/m) (7.18) 


i€O, j=1 
则 置信 区 间 XE [LM,1]J 下 的 信息 协同 系数 为 


N,-1 


6.= 1-20 wy 41) (7.19) 
N È 


RFURSZRAIF ANH FRF WA 


189 


Se U BES HS Ssh Ss tS— AS cose 


190 


在 信息 协同 系数 G HIRAET BEAT FED A AE LUE 
信 区 间 AE [M,1] 下 的 收敛 程度 ,因此 ,引入 参数 一 Nba G, 进行 修正 ,修正 


后 的 信息 协同 系数 为 


G =exG, = Mr n(@+1)) (7. 20) 
4 TEJE 9 fE E DE BGK tek SA 9 f E D E 2 SE RE A 5 个 
等 级 ,对 应 含义 如 表 7. 2 所 示 。 


表 7.2 修正 后 的 信息 协同 系数 含义 


修正 后 的 信息 协同 系数 反映 了 某 城市 或 区 域内 信息 协同 的 差异 水 平 。 
说 明 如 下 : 

(1) 区 别 于 一 般 的 评价 过 程 ,该 评价 结果 给 出 了 必要 的 置信 和 度 前 提 , 且 
置信 和 度 与 信息 协同 系数 成 反比 。 

(2) 选择 不 同 的 距离 测度 方法 和 聚 类 方法 会 产生 不 同 的 测 得 结果 ,在 实 
际 应 用 中 应 在 合理 范围 内 综合 选择 多 种 方法 进行 比较 ,并 根据 实际 情况 对 
多 个 结果 进行 集结 。 

(3) 为 了 保证 结果 的 合理 性 ,不 同城 市 或 区 域 间 的 比较 应 在 同 级 别 的 行 
政 区 划 下 ,在 同等 的 聚 类 方法 和 置信 区 间 内 进行 。 

这 里 需要 特别 指出 ,关于 对 信息 协同 系数 的 含义 解释 是 未 来 的 重点 研 
究 方向 之 一 。 修 正 后 的 信息 协同 系数 Gi 将 信息 组 织 的 信息 协同 差异 性 程度 
划分 为 绝对 平均 、 比 较 平均 、 相 对 平均 、 差 距 较 大 、 差 距 悬 殊 5 个 等 级 。 对 于 
等 级 划分 的 数量 及 各 个 级 别 的 边界 问题 不 在 本 书展 开 论述 , 感 兴趣 的 读者 
可 以 进行 深入 研究 ,通过 调研 获取 足够 数量 的 国内 外 大 中 型 城市 样本 数据 ， 
同时 结合 不 同城 市 和 地 区 的 综合 发 展 水 平 ,建立 科学 的 指标 体系 进行 测算 。 


73 多 源 信息 协同 模式 的 横向 优化 策略 


传统 的 城市 系统 下 信息 流转 模式 比较 单一 ,主要 是 中 心 控制 .节点 参与 
的 中 心 管理 模式 。 这 种 模式 必须 由 中 心 端 发 起 并 控制 信息 协同 的 流程 , 难 

应 对 智慧 城市 下 高 并 发 .多 数据 源 、 高 实时 性 的 需求 ;同时 ,信息 组 织 不 能 
主动 参与 信息 流转 的 管理 过 程 ,对 信息 协同 状态 的 监控 过 于 依赖 中 心 端的 
管理 ,一 方面 随 着 信息 协同 需求 的 增长 造成 了 中 心 端的 负载 过 量 , 另 一 方面 
在 信息 的 反应 速度 上 严重 滞后 于 业务 需求 的 变化 。 

从 信息 协同 网 络 的 横向 结构 上 ,根据 多 源 信息 协同 的 差异 测度 模型 ,在 
模糊 聚 类 的 基础 上 对 信息 协同 度 由 小 到 大 排序 的 N; 类 信息 组 织 进行 二 级 
层次 聚 类 ,将 个 信息 组 织 按 照 信息 协同 水 平分 成 I 类 组 织 ( 协 同 度 较 高 ) 
和 开 类 组 织 ( 协 同 度 较 低 ) 。 

设 工 类 组 织 和 开 类 组 织 分 别 用 Of 和 Or 表示 ,包含 的 信息 组 织 数量 分 
别 为 az 和 nu ,需要 优化 的 信息 协同 流程 (包括 信息 发 送 流程 和 信息 接收 流 
程 ) 数 量 用 6 表示。 定义 实 型 变量 ky © {0:1} i=1,2; sn j=0;1;2 ons 
k; =0 表示 信息 组 织 i 与 信息 组 织 j 不 连接 ,k; =1 表示 信息 组 织 i 与 信息 

组 织 j 连接 ,其 中 7 一 0 表示 信息 协同 中 心 。 对 信息 组 织 i,j(i,j 二 1,2,…， 
n) ,根据 关系 和 矩阵 Pa 和 二 级 聚 类 结果 进行 信息 协同 模式 优化 。 

对 于 PCP 模式 和 PCN/NCP 模式 ,信息 组 织 之 间 不 直接 建立 连接 , 必 = 

0,j 隆 0。 中 心 的 信息 协同 负载 为 


5 ree + koja j) C7:21) 
Q) 若 iEO1 ,jE On ,将 PCP 模式 优化 为 PCN 模式 ,信息 组 织 i 自行 
配置 发 送 流程 ,中 心 配置 转发 流程 和 接收 流程 。 设 信息 组 织 i 的 重复 信息 发 


送 流 程 数量 为 K;, 对 应 信息 流量 为 Li;, 则 中 心 的 信息 协同 负载 减少 
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DD KA, 可 优化 的 信息 协同 流程 数量 为 
Oren 一 2i SD ay (7, 22) 
(2) Æ i€ On ,jEO1 ,将 PCP 模式 优化 为 NCP 模式 ,中 心 配置 发 送 流 
程 和 转发 流程 ,信息 组 织 ) 自行 配置 接收 流程 。 设 信息 组 织 j 的 重复 信息 接 
收 流程 数量 为 Kj, 对 应 信息 流量 为 上, 则 中 心 的 信息 协同 负载 减少 
DDK yA, ,可 优化 的 信息 协同 流程 数量 为 
bp = Dy Dag (7, 23) 
(3) # 1.7 Or ,将 PCP 模式 优化 为 P2P 模式 ,信息 组 织 间 直 接 建立 连 
接 ,hy 二 1,j 一 0, 信息 组 织 i 自行 配置 发 送 流程 ,信息 组 织 j 自行 配置 接收 流 
程 ,中 心 的 信息 协同 负载 减少 > Y) yay + hua) » 可 优化 的 信息 协同 流 
程 数量 为 
diet = D>) Do üi (7. 24) 
i€ 01 jEOL jži 
(4) # ij © On ,保持 PCP 模式 不 变 ,由 中 心 配置 发 送 流程 和 接收 流程 。 
信息 协同 网 络 中 的 信息 流程 总 量 为 


6, = 5 a (7. 25) 
则 多 源 信息 协同 结构 的 可 优化 流程 占 比 为 
p= (ô1-1 +0. 5ò1. n +0. 5ô0. 1 )/6, (7. 26) 


优化 后 的 P2P 模式 改变 了 原 有 的 信息 流向 ,减轻 了 中 心 端的 负载 压力 ， 
利于 高 频率 、 需 求 变化 频繁 的 信息 协同 过 程控 制 。 优 化 后 的 PEN 模式 和 
NCP 模式 分 别 对 发 送 端 和 接收 端 同类 信息 的 所 有 流程 进行 了 整合 , 即 一 类 
信息 对 应 一 个 发 送 /接收 流程 ,在 信息 内 容 、 载 体 或 规则 发 生变 化 时 ,大 幅 减 
少 了 协同 流程 的 调整 ,提高 了 信息 协同 网 络 对 变化 的 响应 速度 。 


应 用 案例 5 智慧 城市 多 源 信息 协同 的 评价 与 优化 Œ) 


1. 信息 组 织 的 将 征 提取 

根据 对 某 智 慧 城市 基础 运行 领域 2011 一 2014 年 的 调研 数据 ,该 市 城市 
基础 运行 领域 主要 涉及 24 个 信息 组 织 ( 政 府 部 门 ,企业 和 社会 团体 ) ,包括 安 
全 监管 部 门 .城管 执法 部 门 、 公 安 部 门 、 国 土 部 门 、 环 保 部 门 .交管 部 门 、 交 通 
部 门 .经济 信 息 化 部 门 . 流 管 部 门 . 民 防 部 门 、 气 象 部 门 、 自 来 水 集团 、 排 水 集 
团 、 电 力 公 司 、 燃 气 集团 、 热 力 集团 市 政 部 门 、 水 务 部 门 、 卫 生 部 门 、 消 防 部 
门 、 质 监 部 门 、 地 勘 部 门 、 应 急 部 门 、 地 区 管理 部 门 。 其 中 信息 提供 方 22 个 ， 
信息 需求 方 10 个 ,协同 信息 155 类 。 令 n= 二 24,w= 二 155 ,信息 组 织 ( 对 象 ) 的 
集合 为 A= {a saran} 。 

信息 组 织 的 信息 协同 水 平 主 要 通过 7 个 方面 的 特征 体现 :“ 信 息 需 求 方 
数量 "“ 共 享 信息 种 类 ”“ 信 息 提供 方 数量 "“ 获 取信 息 种 类 ”“ 信 息 内 容 种 
类 ”“ 信 息 载体 种 类 ”"“ 信 息 周 期 种 类 ”。 令 m= 二 7, 信 息 组 织 的 特征 (属性 ) 
ERAH X= {oy ote ott ,zi)。 结 合 信 息 协 同 的 实际 情况 ,对 原始 特征 值 进行 
处 理 ,规则 如 下 : 

(1)“ 信 息 需 求 方 数量 ”与 “信息 提供 方 数量 "反映 的 均 为 “信息 组 织 协同 的 
数量 ”, 为 了 突出 特征 间 的 差异 性 ,将 两 类 特征 合并 为 一 类 , 令 zx 二 zi 十 x3。 

(2) “共享 信息 种 类 ”与 “获取 信息 种 类 ”反映 的 均 为 “信息 协同 的 数量 ”， 
为 了 突出 特征 间 的 差异 性 ,将 两 类 特征 合并 为 一 类 , 令 x, 二 zs 十 x 。 

(3)“ 信 息 内 容 种 类 ”主要 包括 基础 信息 , 物 联 实时 信息 ,视频 信息 综合 
信息 四 类 , 令 zs 一 zs/4。 

(4)“ 信 息 载 体 种 类 ”主要 包括 结构 化 数据 库 ,视频 数据 库 、 标 准 文本 、 普 
通 文本 、 特 殊 文本 五 类 , 令 ze 一 ze/5。 

O “信息 周期 种 类 ”主要 包括 实时 、 秒 .分钟 . 小 时 天、 静态 六 类 , 令 
7 一 Z71/6。 
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z 各 信息 组 织 的 原始 特征 值 及 转换 后 的 特征 值 如 表 7. 3 所 示 。 根 据 转 换 

售后 的 特征 值 构建 信息 协同 原始 矩阵 P。 

协 

ji R73 信息 组 织 的 特征 值 

市 信息 原始 特征 值 转换 后 的 特征 值 

组 织 x Xz X3 X4 Xs Xe X; xX Ys X3 X4 Xs 

z a | 2]|41] 4] 34] 4] 4] 5 | 6 | 75 1 0.8 0. 83 

a 2 [Os | Aaa] Bi ge Se 1 0.2 0. 33 

A a; sle |z| aja 5 | 13 1 0.6 0. 67 

P a l zj obet Erai | 025 0.2 0.17 

a as eJ Sg Epa {247 7) 6 | 025 0.4 0. 33 
a l 2| | | a2 0.17 
a | 4 | 6 | 6 ]50] 3 | 5 | 5 | 10] 56] 0.75 1 0. 83 
a | 2 3/4 ]7/]3 | 2413] 6 | 10] 075 0.4 0.5 
a | 1}/1]0]o0/]/1 414174) 1 421 | 025 0.2 0.17 
ao | 2} 1]/0/]0]1]21)/1+4) 2 421 +4] 025 0.2 0.17 
a | 5 | 33! 0/]/0/2]/2]1 4) 5 | 33] o5 0.4 0.17 

lin, az | 2] 3 /]/0]o0/ 241 2 | 2 | 0.5 0.2 0. 33 

a, |2]/2]o/o0/1 {141424 2] 025 | 02 0.17 
a | 2] 2]/of/o0/2]/1]2)]2)]2 4] o5 0.2 0. 33 
as} 2/2/]/o0]o0]/2/]/1]2{]2 {2 4] 05 0.2 0. 33 
as | 2} 2]0]/o0}]2]1/]/2/]2]2] 05 0.2 0. 33 
ar | 4] 5] 7/15] 2] 2 | 3 | 11] 20] 05 0.4 0.5 
ag | 2 | 12} 2/3 ]2]1 4/2) 4/15] o5 0.2 0. 33 
ay | 2} 5 ]o0]o0]3]1]3 4] 2415 | 075 0.2 0.5 
ao | 3 | 3 | 8 | 49] 4 | 5 | 5 | a1 | 52 1 1 0. 83 
an | 2 | 8] o0]o]3 {|2 43 ]2 | ] 075 | 04 0.5 
ay. || a | ae) oO | & | 2 |v | a a | ap] os 0.2 0.17 
an o | 21 |136| 4 | 5 | 5 | 21 | 136 1 1 0. 83 
any 0 0 1 4 2 2 3 1 4 0.5 0.4 0.5 


2 信息 组 织 的 一 级 模糊 聚 类 
194 由 表 7. 3 可 见 , 特 征 zi vce 中 存在 特殊 值 , 通 过 公式 (7. 1) 进 行 预 处 理 。 


考虑 到 标准 差 重 点 反映 数据 的 离散 程度 ,而 极 差 重 点 反映 数据 的 范围 和 集 
中 趋势 ,因此 采用 平移 - 极 差 (标准 0-1) 变 换 对 数据 进行 标准 化 处 理 。 特 殊 
值 处 理 和 标准 化 处 理 的 结果 如 表 7.4 所 示 。 由 表 7. 4 构建 信息 协同 标准 矩 
阵 Y。 


表 7.4 特殊 值 处 理 与 平移 - 极 差 变 换 


SSURSSRAASARAe FRF BHA 


信息 特殊 值 处 理 平移 - 极 差 (标准 0-1) 变 换 

组 织 x X Xs Xs Xs x x, Xs X4 Xs 
a 0. 63 0.79 1.00 | 0.80 | 0.83 0. 24 0. 54 1.00 0.75 | 1.00 
az 0.56 0.54 1.00 | 0.20 | 0.33 0.10 0. 00 1.00 0.00 | 0.24 
a; 0.61 | 0.58 | 1.00 | 0.60 | 0.67 | 0.20 | 0.09 | 1.00 | 0.50 | 0.76 
a, 0.53 | 0.54 | 0.25 | 0.20 | 0.17 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 
as 0.66 | 0.55 | 0.25 | 0.40 | 0.33 | 0.31 | 0.02 | 0.00 | 0.25 | 0.24 
as 0.53 | 0.54 | 0.25 | 0.20 | 0.17 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 
ar 0.73 | 0.73 | 0.75 | 1.00 | 0.83 | 0.45 | 0.41 | 0.67 | 1.00 | 1.00 
as 0.63 | 0.57 | 0.75 | 0.40 | 0.50 | 0.24 | 0.07 | 0.67 | 0.25 | 0.50 
as 0.51 | 0.54 | 0.25 | 0.20 | 0.17 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 
aio 0.53 | 0.54 | 0.25 | 0.20 | 0.17 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 dakia 
an 0.61 | 0.65 | 0.50 | 0.40 | 0.17 | 0.20 | 0.24 | 0.33 | 0.25 | 0.00 
aiz 0.53 | 0.54 | 0.50 | 0.20 | 0.33 | 0.04 | 0.00 | 0.33 | 0.00 | 0.24 
ais 0.53 | 0.54 | 0.25 | 0.20 | 0.17 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 
au 0.53 0. 54 0.50 | 0.20 | 0.33 0. 04 0. 00 0. 33 0.00 | 0.24 
ais 0.53 0. 54 0.50 | 0.20 | 0.33 0. 04 0. 00 0. 33 0.00 | 0.24 
ae 0.53 0. 54 0.50 | 0.20 | 0.33 0. 04 0. 00 0. 33 0.00 | 0.24 
air 0.75 0.60 | 0.50 | 0.40 | 0.50 0. 49 0.13 0. 33 0.25 | 0.50 
ais 0.58 0.59 0.50 | 0.20 | 0.33 0.14 0.11 0. 33 0.00 | 0. 24 
aig 0.53 0.55 0.75 0.20 | 0.50 0. 04 0.02 0. 67 0.00 | 0.50 
az 0.75 0.71 1. 00 1.00 | 0.83 0.49 0. 37 1.00 1.00 | 1.00 
azn 0.53 0. 56 0.75 0.40 | 0.50 0. 04 0. 04 0. 67 0.25 | 0.50 
a22 0.51 0.57 0.50 | 0.20 | 0.17 0. 00 0.07 0. 33 0.00 | 0.00 
23 1.00 1.00 1.00 1.00 | 0.83 1. 00 1. 00 1.00 1.00 | 1.00 
an 0.51 0.55 0.50 | 0.40 | 0.50 0. 00 0.02 0. 33 0.25 | 0.50 T 
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由 于 各 特征 均 为 效益 型 变量 ,选择 距离 测度 中 的 欧式 距离 和 切 比 雪夫 
距离 进行 构建 模糊 相似 矩阵 R( 详 细 数据 见 附录 E 的 表 E. 1 和 表 E. 2) 。 计 
算 传递 闭 包 B( 详 细 数据 见 附录 下 的 表 E. 3 和 表 E. 4) 和 和 关 截 矩阵 也 ,分 别 经 
过 18 次 (基于 欧 氏 距离 ) 和 11 次 (基于 切 比 雪夫 距离 ) 迭 代 , 得 到 模糊 聚 类 的 
动态 过 程 ,如 图 7.1 所 示 。 


a 1 720 2 4 61013 9121415161822 82119241117 5 323 


Lill 
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0.9796 
0.9457 
0.898 

0.8788 
0.875 | 


A 120 7234610139 5 8211911121415161822241723 


0.8712 
0.8673 
0.8333 
0.7717 
0.7065 | 


图 7.1 基于 欧式 距离 (上 ) 和 切 比 雪夫 距离 (下 ) 的 模糊 聚 类 


| 根据 图 7. 1 可 以 选 定 置信 度 ,自动 将 该 市 城市 基础 运行 领域 的 信息 组 织 
分 成 若干 类 ;或 选 定 信息 组 织 聚 类 的 数量 ,同步 给 出 该 分 类 结果 的 置信 程 


BE. TEJE, VAR RE RS A W BE bE. HUE fei BE 89% KOER RS ARB 
AZO. 89 ,根据 模糊 聚 类 的 结果 将 24 个 信息 组 织 分 为 10 类 , 即 Noss = 10. 
按 类 的 信息 协同 度 由 小 到 大 排序 ,如 表 7. 5 所 示 。 


表 7.5 置信 度 之 0. 89 的 模糊 聚 类 结果 


聚 类 包含 的 信息 组 织 聚 类 包含 的 信息 组 织 
ad + d6 » A9 » Ayo + G12 + A435 

in meee: ||| ee 

第 2 类 as 第 7 类 as 

第 3 类 an 第 8 类 a 

第 4 类 az 第 9 类 ar saz 

第 5 Qs +19 +21 ,Q24 第 10 类 az 


3. 给 定 置 信 区 间 的 信息 协同 差异 测度 
令 z,(k 二 1,2,…,10) 表 示 第 k 类 组 织 的 信息 协同 度 ,结果 如 表 7. 6 
所 示 。 


表 7.6 置信 度 之 0. 89 的 类 协同 度 


对 应 rw 的 结果 如 表 7.7 所 示 。 


表 7.7 置信 度 之 0. 89 的 类 权重 系数 


w m Ws Ws Ws We w Ws Wo Wio 


0. 02 0. 05 0.10 0.17 0. 23 0. 31 0. 43 0. 60 0:177 1. 00 


则 置信 区 间 AE[0.89,.1] 下 的 信息 协同 系数 为 


9 
Goss =1 | Dw +1)= 0.6323 


i=l 


引入 修正 参数 ec 一 站 一 0. 417 对 G 进行 修正 ,修正 后 的 信息 协同 系 


数 为 
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Gai = ¢ X Go.gg = 0. 263 
根据 表 7.2,GissE[0.2,0.3] 说 明 在 0. 89 的 置信 度 下 该 市 城市 基础 运 
行 领域 的 信息 协同 水 平 相对 平均 。 信 息 协同 曲线 如 图 7. 2 所 示 。 


一 绝对 平均 线 
一 一 信息 协同 曲线 
一 绝对 差异 曲线 


“0 1 2 3 4 5 6 7 8 9 10 
置信 度 >0.89 的 模糊 聚 类 


图 7.2 某 智 慧 城市 基础 运行 领域 的 信息 协同 曲线 


在 图 7. 2 中 ,信息 协同 曲线 与 绝对 平均 线 之 间 的 面积 表示 城市 信息 协同 
水 平 的 差异 程度 , 即 修正 后 的 信息 协同 系数 的 几何 意义 。 面 积 越 小 ( 即 信息 
协同 曲线 弧度 越 小 ) ,说 明 信 息 协同 水 平 的 差异 越 大 ,反之 则 差异 越 小 。 

4 信息 组 织 的 二 级 聚 类 与 信息 流转 模式 优化 

通过 层次 聚 类 方法 ,对 信息 协同 度 由 小 到 大 排序 的 10 类 信息 组 织 进 行 
二 级 聚 类 ,结果 如 图 7. 3 所 示 。 

由 图 7. 3 可 见 , 该 市 城市 基础 运行 领域 的 24 个 信息 组 织 按照 信息 协同 
水 平 可 以 分 为 两 大 类 ,如 表 7.8 所 示 。 


表 7.8 信息 组 织 分 类 


一 级 聚 类 二 级 聚 类 包含 的 信息 组 织 


az» A4» A5» Ags Ags A9» A10% Airs A12% Q13% Ais dis» 
第 1~6 类 I% 


A16 > A17 » Q18 > A19 » A21 » A22 9 A24 


第 7 一 10 类 I 类 Q1+ a3, a7, ax» a23 


ya © o = wv N Aw 上 


S 


图 7.3 信息 组 织 的 二 级 层次 聚 类 


根据 二 级 聚 类 结果 和 模式 优化 策略 ,组 织 ars ass ar, azs azs AIIE S 
同 水 平 较 高 ,相互 之 间 的 信息 协同 采用 P2P 模式 ;对 组 织 a2, as» as, ass 
gs dos i ies Gigs 的 入 
息 协同 仍然 采用 传统 的 PCP 模式 ,对 分 属于 工 类 和 开 类 的 组 织 间 的 信息 协 
同 采用 PCN 或 NCP 模式 。 

根据 公式 (7. 21) 一 公式 (7. 26) 计 算 可 得 : 

065 全 0005 

信息 协同 结构 的 可 优化 流程 占 比 p 为 57.35%, 即 对 现 有 的 半数 以 上 信 
息 协 同 流程 实现 了 优化 。 同 属 工 类 组 织 的 69 类 信息 流转 不 再 通过 中 心 端 ， 
而 是 直接 建立 对 接 关 系 ; 发 送 方 属于 工 类 组 织 .接收 方 属 于 开 类 组 织 的 8 类 
信息 将 重复 发 送 流 程 约 减 为 统一 的 8 个 流程 ,通过 中 心 端 向 不 同 的 接收 方 分 
发 :接收 方 属于 工 类 组 织 ,发送 方 属于 开 类 组 织 的 205 类 信息 将 重复 接收 流 
程 约 减 为 统一 的 205 个 流程 ,通过 中 心 端 自行 接收 。 

优化 后 的 P2P、PCN 和 NCP 模式 改变 了 原 有 PCP 模式 下 单一 的 信息 
流向 ,减轻 了 中 心 端的 负载 压力 ;同时 , 当 外 界 需求 发 生变 化 时 ,减少 了 对 流 
程 的 人 工 干预 ,提高 了 信息 协同 网 络 对 变化 的 自动 调整 能 力 和 响应 速度 。 
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第 8 章 ”基于 凝聚 子 群 的 协同 网 络 关系 测度 


差异 测度 主要 利用 的 是 信息 组 织 的 “属性 变量 ”, 体 现 协 同 结 构 中 信息 
组 织 的 特征 相似 程度 。 对 协同 结构 的 关系 测度 需要 利用 信息 组 织 间 的 “ 关 
系 变量 ”, 分 析 协 同 网 络 中 存在 的 凝聚 子 群 及 其 相互 关系 。 

凝聚 子 群 的 研究 属于 社会 网 络 分 析 (Social Network Analysis, SNA) 范 
畴 。 社 会 网 络 分 析 是 新 经 济 社会 学 中 一 种 重要 的 研究 范式 , 它 认 为 互动 的 
成 员 间 存在 的 关系 非常 重要 ,力图 用 图 论 工具 、 代 数 模 型 技术 描述 关系 模 
式 , 并 探究 这 些 关 系 模式 对 结构 中 的 成 员 或 整体 的 影响 。 社 会 网 络 分 析 的 
核心 在 于 从 “关系 ”的 角度 出 发 研究 社会 现象 和 社会 结构 ,其 中 社会 结构 可 
以 是 行为 结构 ,政治 结构 .经 济 结构 等 多 种 形式 。 

关于 社会 网 络 分 析 的 基本 理论 和 UCINET 软件 的 应 用 ,国内 的 刘 军 教 
授 已 经 做 了 非常 专业 和 详细 的 论述 ,在 此 不 再 费 述 。 考 虑 到 本 书 理 论 体系 
的 完整 性 ,只 对 相关 内 容 进 行 总 体 性 介绍 ,并 给 出 一 个 具体 的 应 用 案例 供 读 
者 参考 。 


81 社会 网 络 分 析 


81.1 社会 网 络 分 析 的 基础 理论 ? 


1. 社会 网 络 分 析 的 基本 概念 和 假设 


网 络 是 由 事物 以 及 事物 之 间 的 某 种 关系 构成 的 ,对 事物 结构 的 关注 可 
以 看 成 是 一 种 网 络 视 角 。 社 会 网 络 指 的 是 社会 行动 者 及 其 间 的 关系 的 集合 。 


OD 感 兴趣 的 读者 可 进一步 参阅 刘 军 教授 的 (社会 网 络 分 析 导 论 ) 和 (整体 网 分 析 讲 义 一 一 
UCINET 软件 实用 指南 》, 详 细 信 息 请 在 本 书 参 考 文献 中 查阅 。 


一 个 社会 网 络 是 由 多 个 点 (社会 行动 者 ) 和 各 点 之 间 的 连 线 (行动 者 之 间 的 
关系 ) 组 成 的 集合 。 用 点 和 线 来 表达 网 络 ,是 社会 网 络 的 形式 化 界定 。 

1) 点 (社会 行动 者 ) 

社会 网 络 分 析 中 的 行动 者 可 以 是 任何 一 个 社会 实体 (单位 或 个 人 ), 如 
学 校 . 村 落 、 组 织 \ 城 市 .国家 等 。 点 可 以 是 任何 社会 行动 者 ,关于 点 的 信息 
必须 是 实际 信息 ,可 用 常规 方法 进行 收集 。 信 息 可 以 是 动态 的 ,也 可 以 是 静 
态 的 。 

2) 关系 (行动 者 之 间 的 联系 ) 

一 般 来 说 , 当 我 们 说 行动 者 之 间 存 在 关系 (ties) 的 时 候 ,“ 关 系 ” 常 常 代 
表 的 是 关系 的 具体 内 容 (relational content) 或 者 是 实质 性 的 现实 发 生 的 关 
系 。 关 系 有 多 种 表现 : 

首先 ,行动 者 之 间 的 关系 类 型 多 样 ,如 朋友 关系 、 上 下 级 关系 、 国 家 之 间 
的 贸易 关系 \ 城 市 之 间 的 距离 关系 等 。 

其 次 ,行动 者 之 间 存 在 “多 元 关系 ”, 如 两 个 国家 之 间 可 能 存在 贸易 关 
系 、 外 交 关 系 .文化 往来 关系 等 。 对 多 元 关系 网 络 的 研究 ,特别 是 整体 网 模 
型 研究 是 当今 社会 网 络 分析 中 最 具 潜 力 的 前 沿 领域 。 社 会 网 络 研究 者 利用 
多 维 量 表 (MDS) ,矩阵 代数 (Matrix Algebra) 、 聚 类 分 析 (Cluster Analysis) 
等 多 种 方法 来 研究 多 元 关系 网 络 数据 。 也 有 很 多 学 者 利用 概率 论 .数理 统 
计 技 术 以 及 计算 机 技术 研究 网 络 变量 的 统计 性 质 , 构 建 多 种 网 络 模型 。 

再 次 ,研究 的 重点 不 同 ,关注 的 “关系 "也 不 同 。 如 果 研 究 整体 网 络 
(whole network) , 即 研究 所 有 行动 者 之 间 的 关系 ,那么 研究 者 需要 分 析 具 有 
整体 意义 的 关系 的 各 种 特征 ,如 互惠 性 、 关 系 的 传递 性 等 。 如 果 研 究 个 体 网 
2 (ego-network) , 即 关 注 个 体 行动 者 , 则 需要 分 析 个 体 网 的 一 些 关系 特征 ， 
例如 ,关系 的 密度 、 同 质 性 等 。 这 种 研究 可 以 利用 随机 抽样 方法 。 

2 社会 网 络 分 析 的 假设 前 提 


社会 网 络 分 析 建立 在 如 下 假设 基础 之 上 : 在 互动 的 单位 之 间 存 在 的 
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关系 非常 重要 ,关系 是 网 络 分 析 理 论 的 基础 。 网 络 学 者 坚持 如 下 前 提 性 
论题 : 

(1) 行动 者 以 及 行动 是 相互 依赖 的 ,而 不 是 独立 的 、 自 主 性 的 单位 。 

(2) 关注 行动 者 之 间 的 关系 (而 不 是 属性 ) ,行动 者 之 间 的 关系 是 资源 
(物质 的 或 者 非 物质 的 ) 传 递 或 者 流动 的 “渠道 ”。 

(3) 个 体 网 络 模型 认为 ,网 络 结构 环境 可 以 为 个 体 的 行动 提供 机 会 ,也 
可 能 限制 其 行动 ,多 元 行动 者 之 间 的 关系 会 影响 到 人 们 的 行为 。 

(4) 网 络 模型 把 结构 (社会 结构 、 经 济 结构 等 ) 概 念 化 为 各 个 行动 者 之 间 
的 关系 模型 “结构 是 网 络 之 网 ”。 

3. 社会 网 络 分 析 的 研究 视角 

在 认识 论 上 ,社会 网 络 分 析 认 为 世界 是 由 网 络 而 不 是 由 群体 组 成 的 。 
从 网 络 而 不 是 群体 出 发 ,可 以 把 世界 看 成 是 网 络 的 结构 ,把 行动 者 之 间 的 关 
系 看 成 是 资源 流动 的 渠道 ,从 而 可 以 通过 分 析 发 现 复 杂 的 资源 流动 网 络 ,而 
不 是 简单 的 分 层 结构 。 这 样 ,我 们 就 应 该 根据 行动 者 之 间 的 关系 模式 来 理 
解 观察 到 的 社会 行动 者 的 属性 特征 (如 种 族 . 生 产 总 量 等 )。 行 动 者 之 间 的 
关系 居于 首要 地 位 ,而 行动 者 的 属性 居于 次 要 地 位 。 

在 方法 论 上 ,社会 网 络 分 析 认 为 从 关系 视角 进行 的 解释 要 优越 于 从 属 
性 视角 进行 的 解释 “网 络 理论 把 解释 建立 在 关系 模式 之 上 ”(Emirbayer， 
1994). 

许多 主流 社会 学 研究 把 社会 结构 和 过 程 看 成 是 个 体 行动 者 的 个 人 属性 
的 总 和 。 不 管 这 些 属性 是 先 赋 的 (性 别 、 智 力 等 ) 还 是 自 致 的 (社会 经 济 地 
位 政治 态度 等 ) ,都 被 看 成 是 个 体 的 属性 因素 。 每 种 属性 都 看 成 是 独立 的 
分 析 单 位 ,对 这 些 因素 进行 分 析 的 各 种 统计 方法 (各 种 多 变量 分 析 技 术 ) 都 
把 拥有 相同 属性 的 个 体 归 为 同一 类 ,从 而 作为 分 析 的 单位 。 

这 种 分 类 分 析 把 个 体 归 为 具有 相同 属性 的 类 ,因此 没有 考虑 到 个 体 所 
处 的 关系 结构 。 此 类 研究 认为 ,社会 行为 之 所 以 出 现 ,是 因为 个 体 拥 有 与 其 


他 个 体 相似 的 属性 ,而 不 是 因为 个 体 处 于 一 定 的 社会 关系 网 络 之 中 。 尽 管 
很 多 社会 学 家 声称 要 通过 结构 研究 考察 社会 关系 ,但 是 ,他 们 所 使 用 的 结构 
技巧 以 及 研究 方法 论 关注 的 仍然 是 变量 之 间 的 结构 ,而 这 种 结构 很 可 能 只 
是 研究 者 自己 建构 出 来 的 ,不 是 行动 者 之 间 的 真实 结构 。 这 种 分 析 有 如 下 
问题 : 一 是 分 析 的 重点 是 行动 者 的 属性 特征 ;二 是 属性 分 析 把 每 个 社会 系统 
成 员 看 成 是 非 结构 性 的 相互 独立 的 单位 ;三 是 把 社会 结构 解释 为 受 规范 引 
导 的 现象 ,这 种 分 析 破 坏 了 结构 关联 的 信息 ;四 是 当 考 察 类 别 的 时 候 , 一 般 
认为 同类 人 的 行为 方式 也 相同 。 

网 络 结构 分 析 可 以 为 分 析 社 会 结构 提供 精致 的 工具 。 网 络 分 析 者 认 
为 ,行动 者 既 属 于 一 定 的 类 别 , 又 处 于 一 定 的 网 络 之 中 ,因而 不 能 仅仅 考察 
其 属性 ,还 应 该 关注 其 所 处 的 关系 网 络 。 例 如 ,不 能 仅仅 把 社会 阶级 看 成 是 
一 个 地 位 集合 ,还 应 该 看 成 是 权力 的 经 济 关 系 和 依赖 性 的 综合 ,所 以 ,从 社 
会 行动 者 所 处 的 社会 关系 的 角度 进行 的 解释 和 研究 是 比较 优越 的 。 当 然 ， 
网 络 研究 者 并 不 排斥 “属性 ”研究 的 正当 性 。 

社会 网 络 分 析 的 解释 不 同 于 非 网 络 解释 之 处 在 于 : 在 研究 中 把 关于 “ 关 
系 ”的 概念 和 过 程 纳入 解释 之 中 。 社 会 网 络 研究 涉及 的 理论 概念 是 关系 性 
的 ,相关 数据 是 关系 性 的 ,对 数据 的 假设 检验 也 使 用 关系 属性 的 分 布 。 无 论 
利用 的 模型 是 为 了 理解 关系 背景 下 的 个 体 行动 ,还 是 直接 研究 结构 ,网 络 分 
析 都 根据 “关系 ”对 结构 进行 操作 。 互 动 的 模式 就 是 结构 ,而 “标准 ”的 社会 
科学 量化 视角 常常 忽视 关系 性 的 互动 结构 。 


81.2 社会 网 络 分 析 的 数据 类 型 和 研究 方法 


1. 社会 网 络 分 析 的 数据 类 型 

社会 网 络 分 析 的 数据 主要 分 为 属性 数据 、 关 系数 据 和 观念 数据 三 类 。 

(1) 属性 数据 : 关于 行动 者 的 自然 情况 、 态 度 、 观 点 以 及 行为 等 方面 的 
数据 ,一 般 被 视 为 个 人 或 者 群体 所 具有 的 财产 .性质 、 特 点 等 属性 ,是 人 们 、 
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对 象 或 者 事件 的 内 在 特点 ,适用 于 分 析 属 性 数据 的 方法 主要 是 变量 分 析 , 如 
相关 分 析 、 回 归 分 析 、 列 联 表 分 析 等 。 各 种 属性 被 看 成 是 特定 变量 (收入 、 职 
业 、 教 育 程度 等 ) 的 取 值 。 

(2) 关系 数据 : 关于 联系 、 接 触 、 联 络 等 方面 的 数据 。 这 类 数据 把 一 个 
行动 者 与 男 一 个 行动 者 连接 在 一 起 ,因此 不 能 还 原 为 单个 行动 者 的 属性 。 
关系 不 是 行动 者 的 属性 ,而 是 行动 者 系统 的 属性 ,这 些 关 系 把 多 对 行动 者 联 
系 成 一 个 更 大 的 关系 系统 。 

传统 数据 关注 的 是 行动 者 和 属性 ,网 络 数据 关注 的 是 行动 者 和 关系 。 
相 比 常规 的 定量 统计 分 析 , 社 会 网 络 分 析 方 法 更 适用 于 分 析 关 系数 据 。 关 
系数 据 主要 包括 两 种 类 型 : 一 是 行动 者 -行动 者 数据 ( 方 阵 数据 ), 即 1- 模 网 
络 数据 ;二 是 行动 者 -事件 (长 方 阵 数 据 ), 即 隶属 关系 数据 。 

(3) 观念 数据 : 主要 描述 意义 动机、 定义 等 ,目前 比较 有 代表 性 的 研究 
方法 是 类 型 分 析 。 

2 社会 网 络 分 析 的 研究 重点 和 方法 

1) 密度 

密度 是 社会 网 络 分 析 中 最 常用 的 一 种 测度 , 它 在 社会 网 络 分 析 中 占 
据 重要 地 位 。 具 体 来 说 ,密度 指 的 是 网 络 中 各 个 成 员 之 间 联 系 的 紧密 程 
度 ,具体 数值 是 通过 网 络 中 实际 存在 的 关系 数量 与 理论 上 可 能 存在 的 关 
系数 量 (完备 图 ) 相 比 得 到 。 成 员 之 间 的 联系 越 多 ,该 网 络 的 密度 也 就 
越 大 。 

2) 网 络 中 心 度 和 中 心 势 

“中 心性 ”是 社会 网 络 分 析 中 的 重点 ,成 员 在 其 社会 网 络 中 具有 怎样 的 
权力 是 社会 网 络 分 析 者 最 早 探讨 的 内 容 之 一 ,它们 从 关系 的 角度 定量 地 界 
定 权力 ,并 通过 中 心 度 和 中 心 势 指数 进行 测量 。 中 心 度 是 衡量 成 员 处 于 网 
络 中 心 位 置 的 程度 ,其 中 点 度 中 心 度 最 常用 ,通过 计算 它 与 多 少 点 直接 相连 
得 到 ,数值 大 表明 该 成 员 处 于 中 心地 位 。 中 心 势 是 度量 整个 网 络 中 心 化 的 


程度 ,测量 网 络 的 总 体 整合 度 或 者 一 致 性 ,如 星 形 网 络 , 所 有 成 员 只 围绕 一 
个 成 员 发 生 联 系 , 其 他 成 员 间 都 没有 联系 ,这 样 网 络 的 中 心 势 最 高 。 

3) 凝聚 子 群 

社会 结构 是 在 社会 成 员 之 间 实 存 或 者 潜在 的 关系 模式 。 它 主要 研究 网 
络 中 存在 多 少 凝 聚 子 群 ,各 个 凝聚 子 群 间 是 什么 关系 ,以 及 凝聚 子 群 内 部 成 
员 之 间 的 关系 具有 怎样 的 特点 等 。 目 前 ,在 社会 网 络 研 究 中 ,还 没有 比较 明 
确 的 凝聚 子 群 的 定义 ,大 体 就 是 指 成 员 之 间 具 有 相对 较 强 的 直接 的 、 紧 密 
的 、 经 常 的 或 者 积极 的 关系 所 构成 的 一 个 成 员 的 子 集合 。 如 果 网 络 中 存在 
较 多 的 凝聚 子 群 ,并 且 这 些 凝聚 子 群 间 缺少 交往 , 则 这 样 的 关系 结构 不 利于 
整体 网 络 的 发 展 。 

4) 结构 相似 性 

结构 相似 性 分 析 能 够 对 社会 行为 和 社会 结构 进行 一 般 化 分 析 , 更 好 地 
把 握 成 员 之 间 关 系 模式 的 相似 性 ,得 到 具有 推广 意义 的 结论 。 在 一 种 网 络 
关系 中 ,如 果 两 个 成 员 相互 蔡 代 后 不 改变 整个 网 络 的 结构 ,就 说 明 这 两 个 成 
员 具 有 结构 相似 性 。 一 般 除了 与 自身 外 ,完全 的 结构 相似 是 很 少见 的 。 结 
构 相 似 性 和 凝聚 子 群 的 分 析 是 不 同 的 ,前 者 的 目的 是 把 相似 的 成 员 分 到 互 
斥 的 群体 中 ,每 一 群体 内 部 的 成 员 之 间 拥 有 类 似 的 结构 特征 ,它们 是 相互 对 
等 的 ,但 各 个 群体 中 的 结 点 间 是 不 对 等 的 ;凝聚 子 群 的 研究 是 为 了 找到 整体 
网 络 中 的 一 些 子 群体 。 

5) 核心 -边缘 结构 

“核心 -边缘 ?结构 的 分 析 范 式 已 经 成 为 区 域 经 济 学 中 一 种 相对 固定 的 模 
式 , 随 着 区 域 经 济 的 发 展 ,城市 间 的 关系 变 得 日 益 复杂 ,中 心 区 、 半 边缘 以 及 
边缘 地 区 不 断 变更 ,这 种 变动 会 影响 区 域 经 济 的 发 展 。 因 此 ,有 必要 清楚 网 
络 结构 中 是 否 存在 核心 一 一 边缘 结构 ,以 及 中 心 城市 在 城市 群 中 的 经 济 位 
置 是 什么 。 
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应 用 案例 6 基于 改进 重力 模型 的 省 际 流动 人 口 的 复杂 
网 络 分 析 ” 


1. 背景 介绍 

流动 人 口 是 中 国 户籍 制度 的 产物 , 指 以 工作 .生活 为 目的 ,离开 户籍 所 
在 地 ,到 其 他 地 方 居 住 的 人 口 ,其 中 省 际 人 口 流动 是 指 跨 越 省 界 的 长 距离 流 
动 。 改 革 开 放 以 来 ,我 国人 口 出 现 大 规模 .多 层次 的 流动 ,人 口 流动 呈现 逐 
年 递增 状态 ,人 口 流动 量 不 断 增 大 ,流动 形式 多 样 化 。 人 口 流 动 是 地 区 间 、 
城乡 间 和 产业 间 市 场 经 济 资源 优化 配置 的 内 在 要 求 ,是 实现 人 口 现 代 化 和 
劳动 价值 规律 的 必然 现象 。 省 际 之 间 的 人 口 流 动 对 于 活化 区 域 间 社会 经 济 
系统 ,改善 地 区 间 经 济 发 展 不 平衡 和 缩减 收益 差距 具有 重要 作用 。 因 此 对 
人 口 的 流动 规律 研究 和 管理 一 直 是 学 术 界 和 政府 部 门 关注 的 热点 ,逐渐 引 
起 各 级 政府 机 构 以 及 管理 部 门 的 重视 。 

国内 外 学 者 对 流动 人 口 进行 了 大 量 的 研究 。 在 研究 视角 上 ,大 部 分 的 
研究 主要 集中 于 人 口 迁 移 的 因素 分 析 、 空 间 分 布 特征 ,政策 制定 与 研究 等 方 
面 ,而 且 多 聚焦 城乡 流动 人 口 分 布 。 励 娜 等 采用 多 元 回归 分 析 的 方法 ,分 析 
中 国 城乡 人 口 流动 的 时 间 和 区 域 趋势 及 驱动 因素 。 乔 晓 春 等 利用 2010 年 第 
六 次 全 国人 口 普查 数据 ,对 不 同 省 市 自治 区 的 跨 省 流动 人 口 和 分 省 户籍 人 
口 分 布 状况 ,以 及 分 省 迁 入 率 和 迁 出 率 进 行 了 估计 。 宋 健 等 对 1984 年 以 来 
北京 市 流动 人 口 管理 的 相关 政策 法 规 进行 了 整理 \ 分 类 和 分 析 , 从 户口 管 
理 、 住 房管 理 . 计 划 生 育 管理 和 就 业 管理 等 方面 作 了 具体 阐述 。 在 研究 方法 
上 针对 流动 人 口 研究 较为 早期 的 主要 集中 于 描述 分 析 、 数 理 统计 方法 以 及 
组 合 数 学 模型 等 。 其 中 侯 贺 平等 采用 改进 辐射 模型 ,从 节点 和 社团 结构 以 
及 无 标 度 和 小 世界 特征 等 方面 ,探讨 在 地 域 差异 影响 下 人 口 流动 的 空间 分 


OQ 本 案例 由 中 国 科 学 院 王 宁 宁 博 士 提供 ,详细 信息 可 查阅 本 书 参考 文献 。 


布 格局 和 复杂 网 络 特征 。 鲍 常 勇 借助 描述 统计 方法 ,对 我 国 286 个 地 级 及 以 
上 城市 流动 人 口 分 布 特征 进行 了 分 析 。 随 着 复杂 科学 和 复杂 网 络 的 研究 兴 
起 ,复杂 网 络 分 析 方法 被 应 用 到 人 口 流动 研究 领域 ,为 研究 提供 了 办 新 的 视 
角 和 方法 。 

复杂 网 络 起 源 于 匈牙利 数学 家 Erdos 和 Renyi 的 随机 图 理论 , 随 着 无 标 
度 网 络 和 小 世界 网 络 的 出 现 ,复杂 网 络 的 研究 开始 进入 新 的 阶段 。 复 杂 网 
络 主 要 研究 的 是 个 体 之 间 相 互 作用 所 产生 的 系统 的 整体 性 质 与 行为 ,从 而 
揭示 和 把 握 复 杂 系统 的 宏观 特征 。 社 会 网 络 分 析 是 复杂 网 络 分 析 的 方法 之 
一 ,是 从 网 络 的 视角 出 发 ,探求 社会 行动 者 以 及 他 们 之 间 关 系 的 研究 方法 ， 
它 起 源 于 物理 学 中 的 适应 性 网 络 ,通过 研究 网 络 关系 ,把 个 体 间 关系 、 微 观 
网 络 与 大 规模 的 社会 系统 宏观 结构 结合 起 来 ,采用 图 论 等 定量 的 数学 分 析 
方法 ,解决 社会 问题 ,该 方法 在 职业 流动 .城市 问题 ` 人 口 流 动 以 及 世界 政治 
经 济 体系 等 领域 广泛 应 用 。 

已 有 的 人 口 复 杂 网 络 研究 多 以 实际 的 人 口 流动 建立 网 络 ,聚焦 人 口 流 
动 网 络 的 拓扑 结构 ,从 而 研究 人 口 流动 的 空间 分 布 特征 和 流动 趋势 。 针 对 
潜在 未 来 可 能 发 生 的 人 口 流动 预期 网 络 研究 还 处 于 相对 薄弱 的 状态 ,多 数 
的 预期 的 流动 人 口 研究 包括 可 达 性 的 研究 以 及 经 典 的 人 口 重力 模型 与 空间 
相互 作用 机 会 模型 研究 。 鉴 于 此 ,本 案例 首先 在 整体 上 根据 省 际 真实 的 人 
口 流动 情况 建立 网 络 ,形成 整体 的 流动 人 口 网 络 视图 ,并 且 探 讨 了 真实 流动 
人 口 网 络 的 拓扑 结构 和 网 络 的 相关 指标 和 特征 ,然后 对 比分 析 了 基于 交通 
成 本 的 流动 人 口 测度 网 络 和 传统 重力 模型 的 流动 人 口 测度 网 络 ,在 此 基础 
上 ,对 经 典 的 重力 模型 进行 修正 ,建立 了 基于 经 济 、 就 业 以 及 交通 的 人 口 流 
动 重力 测度 模型 ,借助 社会 网 络 分 析 (SNA) 方 法 ,依托 UCINET 社会 网 络 
分 析 软 件 , 深 入 研究 省 际 预期 潜在 流动 人 口 网 络 ,分 析 流 动人 口 网 络 的 整体 
特征 , 找 出 网 络 中 的 核心 省 市 .核心 区 域 . 纽 带 省 市 以 及 人 口 流 动 省 市 子 群 ， 
根据 网 络 的 特征 ,促进 省 际 人 口 资源 的 有 效 流通 和 共享 ,为 流动 人 口 管 理 以 
及 产业 布局 提供 科学 决策 。 
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2 省 际 流动 人 口 的 网 络 拓扑 结构 分 析 


本 案例 涉及 的 人 口 流动 是 从 户籍 角度 出 发 ,将 户籍 地 在 外 省 市 的 人 口 
定义 为 流动 人 口 。 根 据 第 六 次 全 国人 口 普查 数据 ,全 国 31 个 省 以 及 直辖 市 
之 间 都 存在 人 口 流动 ,因此 在 此 基础 上 的 流动 人 口 网 络 是 完备 网 络 , 即 31 个 
网 络 节点 之 间 都 存在 联系 。 为 了 更 加 清楚 直观 地 了 解 省 际 流动 人 口 网 络 的 
拓扑 特征 ,对 流动 人 口 量 设 定 相关 阔 值 , 当 省 际 流动 人 口 数 量 在 10 000 以 上 
时 定义 为 省 际 之 间 存 在 大 规模 流动 人 口 ,此 时 节点 省 或 直辖 市 之 间 存 在 人 
口 流动 联系 。 

根据 第 六 次 全 国人 口 普 查 数据 建立 人 口 流 动 矩 阵 , 采 用 社会 网 络 
UCINET 分 析 , 得 到 出 度 与 人 度 最 大 的 前 十 个 省 (自治 区 )( 见 表 8. 1) 。 从 
表 8.1 和 图 8.1 可 以 看 出 ,人 口 流出 省 (自治 区 ) 主 要 集中 在 中 部 经 济 水 平 
较为 不 发 达 的 人 口 大 省 ,其 中 安徽 和 河南 是 最 典型 的 人 口 流出 省 ,与 劳动 力 
输出 有 直接 的 关系 。 人 口 流入 大 省 主要 集中 在 北上 广 以 及 东部 沿海 等 经 济 
较为 发 达 的 省 份 ,值得 关注 的 是 新 疆 在 流入 人 口中 的 数量 排名 也 比较 靠 前 ， 
这 与 国家 援助 新 疆 建 设 的 人 口 政策 相关 。 


表 8.1 流动 人 口 排名 前 十 的 省 (自治 区 ) 


排名 省 (自治 区 ) 省 (自治 区 ) 排名 省 (自治 区 ) 省 (自治 区 ) 
(流出 人 口 ) (流入 人 口 ) (流出 人 口 ) (流入 人 口 ) 
1 安徽 广东 6 江西 福建 
2 河南 上 海 7 广西 天 津 
3 四 川 北京 8 河北 山东 
4 湖南 浙江 9 江苏 辽宁 
5 湖北 江苏 10 山东 新 疆 


(数据 来 源 : 第 六 次 全 国人 口 普查 ) 

度 反映 的 是 网 络 的 中 心性 程度 ,特征 途径 路 径 长 度 是 网 络 整 体 性 质 的 
测度 指标 。 大 规模 省 际 流动 人 口 网 络 是 有 向 网 络 , 具 有 31 个 省 市 节点 ,共有 
1024 条 边 ,具体 的 网 络 特征 统计 如 表 8. 2 所 示 ,每 个 网 络 节点 指向 其 他 节点 


图 8.1 省 际 流动 人 口 网 络 属 性 图 ( 左 为 出 度 , 右 为 入 度 ， 
圆 点 大 小 表示 中 心 度 相 对 大 小 ) 


的 边 的 数量 在 1 一 29 之 间 ,而 指向 每 个 节点 的 边 的 数量 在 1 一 28 之 间 , 略 有 
差异 ,但 是 平均 值 都 为 14. 935 ,说明 大 规模 流动 人 口 网 络 的 中 心性 较为 明 
显 ,存在 度 较 大 的 网 络 权 利 节点 。 网 络 的 平均 距离 为 1. 571, 网 络 中 任意 两 
点 之 间 的 平均 距离 位 于 1 一 2 之 间 ,大 部 分 的 省 节点 通过 1 一 2 个 中 间 省 建立 


流动 人 


联系 ,平均 经 过 1. 571 距离 发 生 人 口 流 动 ,大 规模 省 际 流动 人 口 网 


络 呈 现 小 世界 的 特征 。 


节点 | 边 | 最 大 出 度 | 最 小 出 度 | 平 均 出 度 | 最 大 入 度 | 最 小 入 度 | 平 均 入 度 | 平均 距离 


表 8.2 省 际 流动 人 口 网 络 相关 指标 值 


31 


1024 29 1 14.935 28 1 14. 935 1.571 


度 分 布 反映 的 是 网 络 节点 性 质 的 宏观 统计 特征 。 设 定 阔 值 的 大 规模 流 
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动人 口 网 络 是 有 向 网 络 , 具 有 31 个 省 市 节点 ,共有 1024 条 边 。 由 于 网 络 的 
规模 相对 较 小 ,因此 对 网 络 进行 对 称 化 处 理 , 采 用 累积 概率 分 布 描述 大 规模 
流动 人 口 网 络 的 宏观 统计 特征 ,其 具体 的 计算 公式 如 下 所 示 : 


P(k) = dpe) 

图 8.2 HHT SE PLEASE A C LZ RF ES SA OITA 
处 理 ) ,对 31 ANAT SA BE DA Be HEE HE TE PR BAD GB FE OP A PH PCR) = 
2. 208 933A 一 55, 说 明 网 络 的 度 累 计 概 率 密度 与 度数 呈现 一 定 的 寡 律 关 
系 , 但 是 指数 4 为 0.544 26 二 2, 大 规模 流动 人 口 网 络 的 无 标 度 特征 不 明显 ， 
度 分 布 指数 较 小 ,流动 人 口 网 络 的 异 质 性 比较 高 ,网 络 中 不 同 度 值 的 节点 分 


布 均匀 。 


图 8.2 大 规模 流动 人 口 网 络 的 累计 概率 分 布 ( 双 对 数 ) 


3 基于 流动 人 口 数 量 的 权重 网 络 分 析 


省 际 流动 人 口 网 络 可 以 看 作 以 流动 人 口 数 量 为 权重 的 权重 网 络 , 权 重 
上 为 节点 省 市 到 j 的 流动 人 口 数量 。 由 于 省 际 流动 人 口 网 络 是 有 向 网 络 ， 
所 以 通常 情况 下 rw 和 rw。 为 了 更 好 地 研究 流动 人 口 网 络 的 特征 ,参考 第 2 
部 分 设置 阔 值 10 000 建立 大 规模 的 权重 流动 人 口 网 络 模型 。 

1) 权重 网 络 的 度 分 析 


权重 网 络 的 节点 度 计算 参考 公式 D = >) wy ,其 中 v(i) 是 节点 i 的 邻 


jE 


居 节 点 集合 .根据 人 口 流动 网 络 的 实际 意义 ,省 际 流动 人 口 权重 网 络 的 人 度 


和 出 度 可 以 分 别 定义 为 人 口 流 入 强度 Sa 和 人 口 流 出 强度 Sou o 

表 8.3 分 别 列 出 了 人 口 流入 强度 和 人 口 流出 强度 的 前 十 个 省 ,排名 显示 
人 口 流 入 最 强 的 省 市 主要 集中 分 布 于 中 国 的 东部 沿海 地 区 以 及 京 津 费 等 地 
区 ,这 与 该 地 区 的 经 济 发 展 水 平 较 高 密切 相关 ;此 外 新 疆 地 区 的 人 口 流 入 强 
度 也 相对 较为 突出 ,与 国家 鼓励 西部 大 开发 以 及 援 疆 建 设 政 策 息息相关 。 
人 口 流出 强度 大 的 地 区 主要 分 布 于 中 国 的 中 部 地 区 ,包括 安徽 河南 、 湖 南 、 
湖北 等 省 。 究 其 原因 ,一 方面 经 济 发 展 相 对 薄弱 ,更 多 的 人 口 为 追求 更 好 的 
生活 而 外 出 打工 ; 另 一 方面 人 口 数量 庞大 ,劳动 力 富裕 。 
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表 8.3 人口 流动 权重 网 络 的 度 分 析 


排名 | 人 口 流入 强度 | 人 口 流出 强度 | 排名 | 人 口 流入 强度 | 人 口 流出 强度 


1 广东 安徽 6 福建 江西 
2 上 海 河南 7 天 津 广西 
3 北京 四 川 8 山东 河北 


a 


4 浙江 湖南 9 辽宁 江苏 
江苏 湖北 10 新 疆 山东 stable 

2) 权重 网 络 的 度 与 经 济 人 口 的 相关 性 分 析 
为 了 进一步 验证 省 市 人 口 流动 强度 与 地 区 经 济 和 人 口 总 量 的 相关 关 

系 , 以 地 区 人 均 GDP 和 人 口 总 量 为 自 变 量 ,分 别 对 人 口 流 出 强度 和 人 口 流 

入 强度 进行 简单 线性 回归 (为 了 减少 多 重 共 线性 和 消除 量 纲 的 影响 ,对 原始 

数据 分 布 作对 数 处 理 ) ,回归 结果 见 表 8. 4。 

表 8.4 人口 流 动 强度 回归 统计 指标 及 结果 


归 方 程 R F |Significance F | t- 人 均 GDP |t- 人 口 总 量 


流出 人 口 | Sow= 一 0.97GDP(pe) 十 


0. 90387|62. 4976| 4. 72851E-11 | 一 2. 855159 | 11. 00141 
强度 回归 1.82Po 十 9. 12 


BAT | Se 一 2 495GDP (pe) 十 |. 87452|45. 5204| 1.5866E-09 | 8.1880054 | 4.235571 一 一 一 
强度 回归 0. 625Po—18. 09 一 一 
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人 口 流动 强度 的 回归 方程 中 ,R 约 为 0.9, 回 归 方程 的 拟 合 度 较 好 ,回归 
方程 的 下 统计 量 均 远 远大 于 对 应 的 P 值 ,说 明 人 口 流动 强度 (流出 强度 和 流 
入 强度 ) 与 地 区 人 均 GDP 和 人 口 总 量具 有 显著 的 相关 性 。 相 关系 数 检验 显 
著 , 人 口 流出 强度 与 地 区 人 均 GDP 呈现 反 向 线性 相关 ,与 地 区 人 口 总 量 正 
向 线性 相关 , 较 低 的 地 区 人 均 GDP 和 较 大 人 口 总 量 是 人 口 流出 地 区 的 推 
力 。 人 口 流 入 强度 与 地 区 人 均 GDP 和 人 口 总 量 正 向 线性 相关 ,说 明 一 个 地 
区 的 较 高 经 济 发 展 水 平和 较 大 人 口 总 量具 有 对 外 来 人 口 较 强 的 吸引 力 。 

4 流动 人 口 的 测度 模型 与 复杂 网 络 构 建 

1) 基于 交通 成 本 的 测度 

(1) 测度 模型 描述 

人 口 在 流动 的 时 候 通常 需要 考虑 的 是 交通 成 本 ,包括 交通 时 间 和 旅行 
费用 等 。 通 常情 况 下 ,在 人 口 流入 地 的 经 济 吸引 力 相 似 的 情况 下 ,交通 成 本 
越 低 的 地 区 越 容易 吸引 大 量 的 人 口 流 入 。 

由 于 交通 时 间 和 旅行 费用 与 距离 以 及 交通 工具 的 选择 有 关 , 因 此 人 口 
总 是 倾向 于 向 距离 较 近 的 省 (市 ) 迁 移 。 定 义 S3 为 省 i 与 省 j 之 间 基 于 交通 
成 本 的 预期 人 口 流动 强度 。 具 体 的 计算 公式 如 下 : 


Tl 
S= 
其 中 ,di 为 省 i 与 省 j 的 空间 距离 ,考虑 到 各 省 之 间距 离 统 计 的 难度 ,以 省 会 
城市 之 间 的 铁路 里 程 蔡 代 ,根据 55 的 计算 公式 ,可 以 进一步 计算 基于 交通 成 


本 的 省 市 人 口 流动 可 达 性 AT 一 D) 二 .AT 表示 在 考虑 距离 层面 上 省 ; 对 其 


他 省 市 人 口 的 引力 强度 。 

基于 交通 成 本 的 测度 模型 主要 是 从 可 达 性 的 角度 ,以 各 省 之 间 的 距离 
为 主要 的 测量 指标 来 衡量 人 口 流 动 的 强度 ,指标 计算 简单 ,由 于 距离 不 存在 
方向 性 ,因此 建立 的 人 口 流动 强度 是 无 向 的 ,只 能 粗略 反映 省 际 人 口 流动 
情况 。 


(2) 基于 交通 成 本 的 人 口 流动 可 达 性 与 流动 网 络 

为 了 简化 计算 ,本 案例 将 各 省 看 成 以 省 会 为 中 心 的 理想 的 质点 。 以 省 
会 城市 之 间 的 铁路 距离 为 省 之 间 的 距离 ,计算 各 省 的 人 口 流动 可 达 性 。 表 
8.5 列 出 了 计算 结果 中 可 达 性 排名 前 十 的 省 (市 ) 以 及 实际 流入 人 口 数量 排 
名 前 十 的 省 (市 ) ,图 8. 3 直观 显示 了 可 达 性 结果 与 实际 的 对 比 情况 。 


表 8.5 可 达 性 计算 结果 与 实际 流入 人 口 排名 
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排名 省 (市 ) 流入 人 口 省 (市 ) 可 达 性 
1 广东 17632894 安徽 0. 035174 
2 上 海 6361198 河北 0. 033228 
3 北京 5869769 北京 0. 032995 
4 浙江 5728950 江苏 0. 032834 
5 江苏 4208538 天 津 0. 03179 
6 福建 2708530 湖北 0. 031101 
7 天 津 2459656 山东 0. 030208 
8 山东 1542925 河南 0. 02924 
9 


aF 1405459 上 海 0. 028784 I 


基于 交通 成 本 计算 出 的 流动 人 口 可 达 性 前 十 名 的 省 (市 ) 中 只 有 五 省 
(市 ) 进 入 到 实际 发 生 的 流动 人 口 省 (市 ) 前 十 名 ,分 别 是 北京 .上 海 .江苏 \ 天 
津 和 山东 ,比例 占 到 50%。 这 个 比例 相对 来 说 比较 低 。 根 据 图 8. 3 也 可 以 
明显 地 看 出 ,实际 的 人 口 流动 大 省 与 基于 交通 成 本 计算 出 来 的 人 口 流动 大 
省 差异 明显 ,实际 的 主要 集中 在 中 东部 ,而 计算 得 出 的 省 份 主要 分 布 在 东南 
沿海 以 及 东北 地 区 。 这 说 明 交 通 成 本 虽然 是 影响 省 际 人 口 流动 的 因素 ,但 
不 是 关键 .唯一 的 因素 。 从 以 往 的 研究 以 及 文献 中 也 可 以 得 出 ,影响 省 际 人 
口 流动 的 因素 除了 交通 成 本 (距离 和 费用 ) 外 ,经 济 发 展 水 平 以 及 地 区 的 人 
口 数量 .社会 文化 因素 等 都 是 人 口 流动 的 重要 因素 。 

2) 基于 重力 模型 的 测度 

(1) 测度 模型 描述 | 

重力 模型 起 源 于 物理 学 领域 的 引力 模型 ,作为 描述 人 口 迁 移 的 经 典 简 ”213 
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单数 学 模型 ,其 出 发 点 是 假设 迁移 流 取决 于 出 发 地 与 接收 地 的 人 口 数 及 两 
地 之 间 的 地 理 距 离 , 大 多 数 迁移 所 越过 的 距离 很 短 , 当 吸收 迁移 的 中 心地 点 
距离 迁 出 地 愈 远 时 ,迁移 人 数 迅 速 下降 。 基 于 重力 模型 的 人 口 流动 测度 公 
RUF: 


Sf =k ae. 


其 中 ,S$ 表示 省 i 与 省 j 之 间 的 人 口 引 力 大 小 ,k 为 重力 系数 ,Q; 与 Qi 分 布 
表示 省 i 与 省 j 的 人 口 总 量 ,di 为 省 i 与 省 j 之 间 的 交通 距离 ,b 是 距离 衰减 
系数 ,衰减 系数 一 般 在 1 一 2 之 间 。 

(2) 基于 重力 模型 的 人 口 流动 网 络 

根据 上 述 重 力 模 型 公式 计算 省 际 之 间 的 人 口 引力 ,构建 引力 和 矩阵。 省 
际 之 间 的 距离 采用 省 会 城市 之 间 的 距离 ,城市 之 间 的 距离 统计 是 按照 中 国 
铁路 通达 性 进行 计算 的 ,主要 基于 以 下 考虑 ,中 国 的 铁路 覆盖 面积 比较 广 ， 
城市 之 间 的 交通 方式 中 ,铁路 占 的 比重 较 大 ,以 城市 之 间 的 铁路 距离 作为 城 
市 之 间 的 距离 客观 合理 ,具体 的 数据 来 源 是 中 国 铁路 网 的 统计 数据 。 距 离 
衰减 系数 5b 取 1.5, 重 力 系 数 k 取 1, 地 区 人 口 总 量 Q; 与 Qi 数据 来 源 于 第 六 
次 全 国人 口 普查 统计 数据 。 

计算 每 个 省 i 或 者 直辖 市 i 的 排名 前 五 的 引力 向 量 Si 

Si 他 = [Sa S2 SaSu Ss] 

SaSzSiaSaSs 分 别 为 与 省 i 或 者 直辖 市 i 之 间 引 力 最 大 的 前 五 个 省 
(市 ) ,在 这 个 基础 上 获得 每 个 省 (市 )i 对 应 的 吸引 力 最 大 的 前 五 个 省 (市 )， 
并 认为 省 (市 )i 与 这 五 个 省 或 直辖 市 之 间 存在 潜在 的 人 口 流动 关系 ,建立 人 
口 流 动 网 络 连 线 。 根 据 计 算得 出 的 省 际 人 口 引力 S59 ,进一步 计算 省 (市 ) 的 
综合 引力 势能 E?: 


Ef = 2/S8 
综合 引力 势能 ES 反映 的 是 省 (市 )i 人 口 流 动 潜力 。 综 合 引力 势能 ES 
越 大 ,说 明 省 (市 )i 越 有 可 能 成 为 流动 人 口 的 大 省 , 既 包 含 了 流出 人 口 大 省 


也 包含 了 流入 人 口 大 省 。 

借助 UCINET 社会 网 络 分 析 软 件 ,对 建立 的 基于 传统 重力 模型 的 预期 
流动 人 口 网 络 的 凝聚 子 群 . 聚 类 系数 以 及 最 短 距 离 等 网 络 特征 进行 分 析 , 考 
察 流动 人 口 网 络 的 整体 网 特征 。 通 过 分 析 得 知 ,基于 传统 重力 模型 的 预期 
流动 人 口 网 络 存在 以 下 特征 : 流动 人口 网 络 呈 现 小 世界 特征 。 在 流动 人 
口 网 络 中 , 聚 类 系数 为 0. 49 ,特征 长 度 为 2.855, 说 明 网 络 中 任意 两 点 之 间 的 
平均 距离 位 于 2 一 3 之 间 ,大 部 分 的 省 及 直辖 市 节点 通过 2 个 或 3 个 中 间 省 
(市 ) 建 立 人 口 流动 联系 ,平均 经 过 2. 855 距离 产生 人 口 流动 ,省 际 预期 人 口 
流动 网 络 呈现 明显 的 小 世界 网 络 特征 ,有 利于 全 国 范围 内 人 力 资源 的 有 效 
利用 和 共享 ,对 促进 经 济 繁荣 具 有 重要 作用 。@ 预 期 流动 人 口 网 络 具 有 明 
显 的 凝聚 性 ,存在 若干 凝聚 子 群 或 者 社团 结构 。 根 据 网 络 分 析 结果 ,省 际 人 
口 流动 具有 明显 的 团体 性 和 聚集 性 。 全 国 范围 来 看 ,主要 分 为 八 个 区 域 , 如 
图 8. 3 所 示 ,包括 东 三 省 ` 华 中 、 华 南 .中 东部 沿海 . 京 津 划 等 地 区 。 


图 8.3 基于 重力 模型 的 流动 人 口 网 络 子 群 


根据 数据 计算 的 综合 引力 势能 结果 如 表 8. 6 所 示 。 

结果 显示 ,根据 重力 模型 计算 出 的 山东 、 河 南 、 江 苏 等 流动 人 口 大 省 与 
实际 发 生 人 口 流动 的 主要 省 (市 ) 结 果 基 本 一 致 ,因此 基于 重力 模型 的 综合 
引力 势能 一 定 程度 上 反映 了 一 个 省 (市 ) 的 人 口 流动 能 力 .但 是 由 于 引力 势能 
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表 8.6 引力 势能 前 十 强 的 省 (市 ) 以 及 流入 、 流 出 人 口 大 省 (自治 区 ) 


省 (市 ) 引力 势能 流入 人 口 大 省 流出 人 口 大 省 
山东 1. 286702 广东 安徽 
河南 1. 278106 上 海 河南 
江苏 1. 250103 北京 四 川 
安徽 1. 118393 浙江 湖南 
河北 1. 082001 江苏 湖北 
湖北 0. 914416 福建 江西 
湖南 0. 837019 天 津 广西 
广东 0. 828007 山东 河北 
浙江 0. 664251 uF 江苏 
江西 0. 645297 新 疆 山东 


是 一 个 无 向 计算 指标 ,所 以 由 此 得 出 的 流动 人 口 大 省 也 不 具备 人 口 流动 的 
方向 性 ,无 法 区 分 是 流出 人 口 大 省 还 是 流动 人 口 大 省 。 因 此 需要 对 流动 人 
口 的 测度 模型 进一步 改进 ,构造 可 以 测 出 方向 性 的 人 口 流动 指标 。 

3) 基于 改进 重力 模型 的 测度 

人 口 流动 受 多 种 因素 影响 ,包括 交通 成 本 、 经 济 发 展 水 平 .人口 以 及 社 
会 文化 因素 等 。 上 述 重 力 模型 存在 两 方面 不 足 , 一 是 只 考虑 了 人 口 和 交通 
两 个 方面 ,二 是 计算 得 出 的 测度 不 具 方 向 性 :以 此 构造 的 流动 人 口 矩 阵 是 对 
称 和 矩阵 。 为 了 更 加 准确 地 度量 经 济 等 其 他 因素 对 省 际 人 口 流动 的 影响 ,本 
案例 对 重力 模型 进行 了 修正 ,建立 了 基于 交通 、 经 济 和 人 口 的 重力 测度 模 
型 ,其 基本 的 计算 公式 如 下 : 


co 
T? i 


R§ =G 


5 


R}: 表示 省 (市 ) 的 人 口 流向 省 (市 )j 的 预期 强度 ,数值 越 大 ,说 明 从 省 
(市 )i 流 向 省 (市 )j 的 人 口 数量 越 多 ,强度 越 大 。 


G: 表示 重力 模型 的 重力 常数 ,一 般 取 值 为 1。 

aB Y: 分 别 表示 人 口 经济 以 及 就 业 情 况 下 不 同 因素 的 权重 ,根据 具体 
实际 情况 采取 不 同 的 权重 考虑 人 口 ,经 济 以 及 就 业 对 人 口 流 动 的 影响 程度 。 

Pi: 表示 省 (市 ) 的 人 口 总 量 ,包括 常住 人 口 和 外 来 流动 人 口 ,常住 人 口 
和 流动 人 口 的 度量 均 参 照 第 六 次 全 国人 口 普查 的 相关 规定 。 常 驻 人 口 二 户 
口 在 本 辖区 人 也 在 本 辖区 居住 十 户口 在 本 辖区 之 外 但 在 户口 登记 地 半年 以 
上 的 人 十 户口 待定 (无 户口 和 口袋 户口 ) 十 户口 在 本 辖区 但 离开 本 辖区 半年 
以 下 的 人 。 外 来 流动 人 口 包 括 离开 户口 登记 地 半年 以 上 、 来 到 本 辖区 不 到 
半年 的 外 来 流动 人 口 ,不 包括 户籍 人 口中 离开 本 辖区 半年 以 上 的 人 。 

Y;: 表示 省 (市 ) 的 城镇 工资 总 额 , 指 年 度 内 在 岗 职 工 工资 总 额 \ 劳 务 派 
址 人 员工 资 总 额 和 其 他 就 业 人 员工 资 总 额 之 和 。 

Wi: 表示 省 (市 ) 的 城镇 登记 失业 率 ,具体 解释 为 城镇 登记 失业 人 员 与 
城镇 单位 就 业 人 员 ( 扣 除 使 用 的 农村 劳动 力 、 聘 用 的 离 退休 人 员 、 港 澳 台 
外 方 人 员 ) ,城镇 单位 中 的 不 在 岗 职 工 \ 城 镇 私营 业主 .个体户 主 、 城 镇 私营 
企业 和 个 体 就 业 人 员 ,城镇 登记 失业 人 员 之 和 的 比 。 

Ti: 表示 距离 阻尼 ,其 中 T; 为 省 (市 )i 与 省 (市 )j 之 间 的 交通 距离 ,b 是 
距离 衰减 系数 ,衰减 系数 一 般 在 1 一 2 之 间 。 

修正 后 的 模型 具有 如 下 特点 : 

(1) 模型 将 经 济 因 素 ,就 业 影响 以 及 交通 成 本 考虑 进去 ,相对 全 面 地 测 
量 了 省 际 之 间 的 人 口 流动 可 能 性 。 

(2) 模型 测量 的 人 口 流 动 具 有 方向 性 。 根 据 计 算 公式 ,一 般 情况 下 由 于 
各 地 的 经 济 发 展 水 平 及 城镇 工资 总 额 和 失业 率 不 同 ,计算 得 出 的 RG ARG ， 
因此 根据 修正 后 的 重力 测度 模型 计算 得 出 的 省 际 可 能 存在 的 人 口 流动 矩阵 
式 是 非 对 称 的 ,符合 人 口 流 动 的 规律 。 

(3) 模型 反映 了 人 口 流 动 的 基本 规律 : 经 济 条 件 差异 越 大 ,距离 越 近 ， 
从 一 地 向 另 一 地 的 人 口 流量 越 大 。 
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5 基于 修正 重力 模型 的 预期 人 口 流 动 网 络 实证 研究 

本 案例 人 口 经 济 以 及 失业 率 数据 采用 国家 2012 年 的 统计 数据 以 及 第 
六 次 全 国人 口 普 查 数据 ,时 间 节 点 为 2012 年 ,保证 了 数据 的 时 效 与 新 颖 性 。 
由 于 数据 的 不 完整 性 ,剔除 了 中 国 香港 、 澳 门 以 及 台湾 ,保留 了 27 个 省 (自治 
区 ) 和 4 个 直辖 市 。 省 (市 ) 之 间 的 距离 统计 是 按照 中 国 铁路 通达 性 进行 计算 
的 ,主要 基于 以 下 考虑 ,中 国 的 铁路 覆盖 面积 比较 广 , 城 市 之 间 的 交通 方式 
中 ,铁路 占 的 比重 较 大 ,以 城市 之 间 的 铁路 距离 作为 城市 之 间 的 距离 客观 合 
理 , 具 体 的 数据 来 源 是 中 国 铁路 网 的 统计 数据 。 为 了 计算 的 简便 性 以 及 可 
操作 性 ,省 际 之 间 的 距离 以 省 会 城市 之 间 的 距离 代替 。 

D 省 际 流动 人 口 权利 的 量化 分 析 

社会 网 络 分 析 中 ,省 际 流 动人 口 网 络 中 节点 省 市 的 权利 量化 指标 有 中 
心 度 和 中 心 势 指数 ,中 心 度 指标 是 对 个 体 权利 的 量化 分 析 指 标 ,而 中 心 势 指 
数 是 对 群体 权利 的 量化 分 析 。 度 数 中 心 度 越 大 ,表明 相 邻 的 节点 数目 越 多 ， 
该 节点 的 地 位 越 核心 ,在 流动 人 口 网 络 中 占据 关键 地 位 。 预 期 省 际 人 口 流 
动 网 络 是 权重 有 向 网 络 , 其 权重 的 大 小 与 预期 人 口 迁 移 量 的 大 小 是 一 致 的 ， 
因此 预期 省 际 人 口 流动 网 络 的 中 心 度 分 析 在 一 定 程度 上 反映 了 跨 省 预期 人 
口 流量 的 核心 省 (市 ) 情 况 。 

对 省 际 流动 人 口 网 络 的 中 心性 分 析 得 到 表 8.7。 计 算 结 果 显 示 , 人 口 流 
出 大 省 依然 集中 在 中 部 地 区 ,包括 安徽 ,河南 、 河 北 、 湖 南 、 湖 北 等 省 ,东部 沿 
海地 区 的 山东 省 在 人 口 流 出 方面 比较 突出 ,而 西部 地 区 流出 人 口 大 省 则 以 
山西 和 陕西 为 住 ;在 人 口 流 入 方面 .广东 省 的 中 心 度 占据 首位 ,随后 是 山东 、 
江苏 北京 和 上 海 。 根 据 社会 网 络 分 析 结 果 的 绘制 社会 网 络 图 8. 4( 图 中 的 
节点 大 小 代表 节点 中 心 度 属性 的 相对 大 小 ) 直 观 显示 ,未 来 人 口 流动 依然 活 
跃 于 中 东部 地 区 ,呈现 两 纵 的 格局 : 中 部 狭长 区 域 人 口 流出 为 主 ,东部 沿海 
狭长 区 域 人 口 流出 为 主 。 人 口 流出 区 域 主要 集中 于 以 安徽 省 为 关键 地 位 的 
中 部 狭长 地 域 , 一 方面 与 中 部 地 区 的 经 济 发 展 水 平 较 低 有 关 , 大 量 的 人 口 寻 


求 外 省 的 经 济 效益 而 发 生 人 口 迁 出 行为 ; 男 一 方面 中 部 地 区 的 人 口 数量 大 ， 
劳动 力 富裕 ,是 劳动 力 输出 的 典型 区 域 。 人 口 迁 出 区 域 主要 集中 在 东部 沿 
海地 区 ,其 中 广东 省 为 主要 的 迁 入 大 省 。 从 宏观 上 看 ,我 国 的 预期 人 口 流动 
状态 是 中 部 流向 东部 沿海 地 区 ,而 西部 地 区 的 预期 人 口 流动 强度 ( 迁 出 和 迁 
出 ) 相 对 较 弱 ,但 是 否 发 生 大 规模 内 部 迁移 有 待 进一步 的 研究 。 此 外 通过 观 
察 对 比 预期 人 口 流动 网 络 中 各 省 市 节点 的 出 度 和 入 度 情况 ,山东 省 和 安徽 
省 的 出 度 和 入 度 都 比较 突出 ,说 明 这 两 个 省 市 在 人 口 的 迁 出 和 迁 入 方面 都 
处 于 网 络 中 相对 重要 的 关键 地 位 ,控制 着 人 口 流动 网 络 的 人 力 资源 流动 , 因 
此 需要 政府 加 强 对 这 两 个 省 市 的 人 口 流动 控制 与 引导 ,充分 发 挥 网 络 资源 
的 配置 作用 。 网 络 的 出 度 和 入 度 中 心 势 分 别 为 6.974% 和 14. 728% ,相对 很 
小 ,说 明 预 期 流动 人 口 网 络 的 整体 中 心性 不 是 很 强 , 网 络 中 存在 大 量 地 位 相 
对 平等 的 节点 ,这 与 前 面 分 析 的 人 口 流动 的 区 域 性 一 致 。 从 图 8. 4 可 以 看 出 
人 口 流动 强度 较 大 的 几 个 省 市 包括 湖南 、 湖 北 、 河 南 、 安 徽 以 及 河北 等 地 均 
分 布 在 中 部 地 区 ,因此 对 人 口 流动 的 相关 政策 倾斜 应 以 中 部 地 区 为 主导 。 


表 8.7 省 际 流动 人 口 网 络 出 度 与 入 度 (前 十 名 ) 


省 (自治 区 ) .市 出 度 省 (自治 区 ) .市 AE 
安徽 2372894.75 广东 4124329 
河北 1916444. 25 山东 2978315 
湖南 1698649. 375 江苏 2695266 
江西 1480265. 125 北京 2295092 
湖北 1449730.5 上 海 2190427 
山西 1244735. 25 浙江 1790209 
河南 1173993. 625 河北 1071571 
广西 1088378. 125 湖北 888464. 3 
陕西 932560. 375 四 川 775558. 1 
山东 884350. 563 安徽 771666. 9 
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图 8.4 基于 中 心 度 属性 的 人 口 流动 的 社会 网 络 属性 图 
(节点 的 大 小 代表 节点 中 心 度 属 性 的 相对 大 小 ) 


2) 省 市 流动 人 口 网 络 的 关联 性 和 小 世界 分 析 

社会 网 络 中 ,关联 性 测量 的 是 网 络 中 行动 者 之 间 的 关联 特征 ,关联 度 低 
的 网 络 权 利 集 中 ,信息 集中 ,网 络 中 的 行动 者 地 位 不 平等 ,并 且 网 络 极 易 受 
到 个 别 节点 的 影响 ,具有 一 定 的 分 派 结 构 ;而 关联 度 高 的 网 络 , 权 利 分 散 , 信 
息 分 散 ,网 络 中 行动 者 之 间 的 地 位 是 平等 的 ,不 容易 受到 个 别 点 的 影响 ,网 
络 结构 是 均匀 的 。 根 据 修正 的 重力 模型 建立 的 预期 省 际 流动 人 口 网 络 是 完 
备 网 络 , 网 络 中 的 所 有 节点 均 互 相连 接 。 为 了 进一步 探讨 流动 网 络 的 关联 
性 和 小 世界 特征 ,对 流动 网 络 进行 进一步 处 理 : 保留 每 个 与 每 个 节点 连接 强 
度 在 前 五 之 内 的 连 线 , 剔 除 其 余 连 线 , 得 到 新 的 简化 的 高 强度 预期 省 际 人 口 
流动 网 络 ,以 便 更 好 地 分 析 网 络 的 拓扑 结构 。 计 算 结果 如 表 8. 8 所 示 。 


表 8.8 省 际 流动 人 口 网 络 的 关联 性 和 小 世界 指标 


网 te 具体 数值 网 络 指标 具体 数值 
IK KE (Connectedness) 0.4914 | 聚 类 系数 (Clustering coefficient) | 0. 624 
效率 (Efficiency) 0. 9016 | 距离 (Distance) 1. 548 
最 近 上 限 (LUB) 1. 0000 


在 预期 省 际 流动 人 口 网 络 中 ,关联 度 指数 值 为 0. 4914, 说 明 大 规模 的 人 
口 流动 网 络 中 节点 的 可 达 性 在 50% 左 右 。 网 络 的 效率 为 0. 9016 ,理论 上 来 
说 在 已 知 网 络 中 所 包含 的 成 分 数 确定 的 情况 下 ,有 近 90% 的 网 络 连 线 是 多 
余 的 ,但 是 多 余 的 网 络 联系 反映 了 大 规模 预期 人 口 流动 网 络 的 紧密 联系 性 。 
最 近 上 限 为 1 ,说明 大 规模 预期 人 口 流 动 网 络 的 任何 省 节点 之 间 都 具有 共同 
的 邻居 ,可 以 通过 共同 的 邻居 建立 起 联系 ,加 快 人 口 的 流动 和 人 力 资源 的 共 
享 和 传递 。 网 络 的 聚 类 系数 和 特征 途径 长 度 是 小 世界 的 测量 指标 , 聚 类 系 
数 是 局 部 网 络 结构 的 测度 指标 而 特征 路 径 长 度 是 网 络 整体 性 质 的 测度 指 
标 , 小 世界 网 络 具 有 相对 较 小 的 距离 和 相对 较 大 的 聚 类 系数 。 在 预期 省 际 
流动 人 口 网 络 中 , 聚 类 系数 为 0.624 ,特征 长 度 为 1. 548 ,说明 网 络 中 任意 两 
点 之 间 的 平均 距离 位 于 1 一 2 之 间 , 大 部 分 的 省 点 通过 1 一 2 个 中 间 省 建立 联 
系 , 平 均 经 过 1. 548 距离 建立 合作 关系 ,预期 省 际 流动 人 口 网 络 呈 现 明 显 的 
小 世界 网 络 特征 。 小 世界 特征 的 省 际 流 动人 口 网 络 有 利于 网 络 中 人 口 的 流 
动 和 人 力 资源 的 传播 ,对 省 市 之 间 的 人 力 合作 和 经 济 发 展 具有 重大 意义 。 

3) 预期 省 际 流动 人 口 网 络 的 结构 洞 与 凝聚 性 分 析 

在 社会 网 络 中 ,结构 洞 指 的 是 两 个 行动 者 之 间 的 非 元 余 的 联系 。 根 据 
伯 特 理论 ,结构 洞 能 够 为 其 占据 者 获取 信息 利益 和 控制 利益 提供 机 会 ,从 而 
比 网 络 中 其 他 位 置 成 员 更 具有 竞争 优势 。 结 构 洞 的 衡量 指标 分 为 四 个 方 
面 : 有 效 规模 、 效 率 、 限 制度 以 及 等 级 度 。 由 于 限制 度 是 衡量 结构 洞 的 最 重 
要 的 指标 ,因此 本 案例 分 析 中 重点 考虑 限制 度 。 采 用 UCINET 软件 对 预期 
省 际 大 规模 流动 人 口 网 络 进行 结构 洞 分 析 , 得 到 指标 数值 如 表 8. 9 所 示 。 


表 8.9 省 际 流动 人 口 网 络 的 结构 洞 指标 


省 (自治 区 ) .市 有 效 规模 效率 限制 度 等 级 度 
河北 11. 694 0. 487 0. 149 0.050 
河南 14. 924 0.497 0.140 0.057 
陕西 15. 054 0. 502 0. 140 0. 057 
山西 3. 917 0. 301 0. 181 0. 049 
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省 (自治 区 ) .市 有 效 规模 效率 限制 度 等 级 度 
山东 5. 891 0. 347 0. 175 0.036 
甘肃 6. 104 0. 359 0. 167 0.034 
wt 5. 895 0. 347 0.170 0.019 
# 6. 833 0. 380 0. 164 0. 024 
黑龙 江 7.326 0. 407 0. 168 0. 034 
云南 9. 838 0. 428 0. 154 0. 049 
贵州 9. 426 0. 428 0. 157 0. 056 
广东 5.522 0.325 0. 170 0. 046 
福建 4. 053 0. 253 0. 179 0. 036 
海南 3. 281 0. 219 0. 179 0.018 
四 川 15. 295 0. 510 0. 140 0.058 
湖北 14. 878 0. 496 0. 141 0. 060 
湖南 15. 148 0. 505 0. 141 0.059 
江西 10. 868 0. 453 0. 150 0. 049 
安徽 13.750 0.491 0. 143 0. 056 
江苏 4. 474 0. 280 0. 170 0.039 
浙江 4, 684 0. 276 0. 168 0. 029 
青海 4. 184 0. 279 0.177 0. 029 
新 疆 5. 583 0. 328 0. 165 0.019 
内 蒙古 13. 385 0. 496 0. 142 0. 053 
TA 14. 662 0. 543 0. 136 0. 054 
西藏 11. 236 0. 449 0. 149 0.062 
广西 6.217 0.345 0. 168 0, 042 
北京 3.733 0. 267 0.177 0.019 
天 津 8. 903 0. 424 0. 157 0. 046 
重庆 3. 611 0. 258 0. 184 0. 030 
上 海 15. 278 0. 509 0. 140 0. 059 


根据 结果 显示 ,结构 洞 的 限制 度 较 大 的 省 市 有 广东 、 福 建 、 海 南 、 四 川 、 
江苏 .青海 .北京 和 重庆 等 ,其 中 西部 较 偏远 的 省 市 占据 了 近 50% ,说 明 西部 
城市 在 预期 的 省 际 大 规模 流动 人 口 网 络 中 运用 结构 洞 的 能 力 较 弱 , 受 限制 
性 比较 强 , 因 此 西部 偏远 省 市 对 其 他 省 市 的 人 口 流动 依赖 性 比较 强 。 为 了 
降低 这 种 依赖 性 ,应 鼓励 中 东部 人 口 流动 密集 的 省 市 与 西部 地 区 的 人 口 互 
动 ,鼓励 人 力 资源 向 西部 迁移 ,加 快 西部 地 区 的 发 展 。 与 此 同时 ,北京 、 江 
苏 、 广 东 的 人 口 迁 入 发 达 省 市 的 受 限制 性 也 比较 强 , 这 是 因为 全 国 预期 大 部 
分 地 区 的 人 口 流向 这 三 个 典型 地 区 的 数量 都 比较 强 ,因此 各 个 省 市 累积 的 
限制 度 就 比较 高 。 从 限制 度 和 矩阵 看 ,对 北京 ,广东 和 江苏 限制 性 比较 强 的 省 
市 主要 分 为 两 类 ,一 类 是 西部 偏远 省 市 ,一 类 是 中 部 人 口 流动 大 省 ,因此 需 
要 降低 北京 .广东 和 江苏 的 限制 性 ,也 需要 加 强 中 部 人 口 流 动 大 省 和 西部 偏 
远 城市 的 人 口 流动 强度 。 

网 络 的 凝聚 性 分 析 是 通过 对 网 络 中 心 行动 者 子 集 的 特征 来 刻画 与 研究 
社会 群体 ,采用 多 种 网 络 属性 对 群体 的 凝聚 性 进行 量化 处 理 ,比如 派系 
丛 核 以 及 块 分 析 等 ,其 中 派系 主要 是 建立 在 互惠 性 基础 上 的 凝聚 子 群 , 
从 核 是 建立 在 点 度 上 的 凝聚 子 群 , 块 是 建立 在 子 群 内 外 关系 基础 上 的 凝 
RTR. RH UCINET 软件 对 预期 省 际 人 口 流 动 网 进行 聚 类 分 析 , 计 算出 
省 际 流 动人 口 网 络 存在 的 8 个 位 置 ( 块 ) ,得 到 8 个 块 。 表 8. 10 列 出 了 每 个 
网 络 子 群 的 分 类 情况 。 


表 8.10 省 际 流动 人 口 网 络 子 群 的 分 类 情况 


子 群 成 R 子 群 成 OR 
TES 
子 群 1 河北 、 内 蒙古 .山西 .陕西 天津、 pms | 河南 
宁夏 
子 群 2 | 吉林 辽宁、 黑龙 江 子 群 6 | 山东 、 北 京 


PRES | 甘肃 ,新疆 、 青 海 .安徽 .西藏 子 群 7 | 广东 


福建 .广西 湖南 江西 贵州、 湖 


北 ` 重 庆 `、 四 川 , 海 南 ` 云 南 Bs Laa 


子 群 4 
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根据 凝聚 子 群 分 类 情况 ,发现 生成 的 人 口 流动 子 群 与 地 域 位 置 关 系 密 
不 可 分 ,预期 省 际 人 口 流动 主要 分 为 8 个 区 域 ( 见 图 8. 5) : 东 三 省 地 区 、 华 北 
地 区 \ 西 部 地 区 ,长 三 角 地 区 、 珠 三 角 地 区 、 京 津 蔓 地 区 、 东 南 地 区 、 河 南 地 
区 ,具有 一 定 的 地 域 分 布 特性 ,其 中 河南 省 和 广东 省 各 自分 别 成 为 一 个 社区 
子 群 。 结 合 预期 人 口 流 动 网 络 的 中 心性 分 析 , 可 以 推测 ,在 人 口 流 出 方面 ， 
河南 省 作为 人 口 资源 大 省 控制 着 整个 预期 省 际 人 口 流动 的 网 络 资源 ,应 予 
以 重点 关注 。 广 东 省 作为 典型 的 人 口 流 入 大 省 在 接纳 外 来 人 口 方 面 居于 网 
络 中 的 关键 位 置 ,在 人 口 流 动 网 络 中 发 挥 重 要 的 核心 引领 作用 。 根 据 区 域 
控制 以 引领 网 络 中 的 人 口 合理 流动 ,对 于 省 际 人 力 资源 的 共享 和 省 际 经 济 
的 发 展 具 有 重要 的 作用 。 
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图 8.5 人 口 流动 的 省 群 分 布 


整个 网 络 的 密度 值 经 过 计算 为 26585. 3750 ,将 计算 得 出 的 密度 矩阵 表 
中 大 于 26585. 3750 的 值 都 修改 为 1, 小 于 26585. 3750 的 值 都 修改 为 0, 得 到 
的 子 群 密度 矩阵 如 表 8. 11 所 示 。 


R811 子 群 密度 矩阵 

子 群 1 | 子 群 2 | 子 群 3 | 子 群 4 | 子 群 5 | 子 群 6 | 子 群 7 | 子 群 8 a 

FHI 0 0 0 0 1 1 i 1 6 
FH 2 0 1 0 0 1 1 1 1 $ 
子 群 3 0 0 0 0 1 1 1 1 z 
子 群 4 0 0 0 0 1 1 1 1 全 
子 群 5 1 0 0 0 0 1 1 1 网 
子 群 6 0 0 0 0 1 1 1 1 $ 
子 群 7 0 0 0 0 0 0 0 0 
子 群 8 0 0 0 0 1 1 1 1 人 


上 述 分 析 得 到 的 是 一 个 非 对 称 和 矩阵 ,由 此 得 到 如 下 结论 : 预期 省 际 流动 
人 口 网 络 分 为 8 个 子 群 ,部 分 子 群 存 之 间 存 在 人 口 流动 关系 ,帮派 性 相对 较 
为 明显 。 人 口 流动 关系 比较 频繁 地 出 现在 子 群 5、 子 群 6、 子 群 7 以 及 子 群 8 
之 间 , 东 三 省 地 区 代表 的 子 群 2 内 部 存在 显著 的 人 口 流 动 关系 。 广 东 为 代表 
的 子 群 7 与 其 他 子 群 之 间 只 存在 人 口 迁 入 的 单 向 关系 , 子 群 1、 子 群 2、 子 群 bl 
3 以 及 子 群 4 之 间 不 存在 明显 的 人 口 流动 关系 。 以 子 群 为 节点 , 子 群 内 部 及 
子 群 之 间 的 人 口 流动 关系 为 边 得 到 简化 图 , 见 图 8. 6。 


ao 一 人 一 
one 


子 群 6 


图 8.6 子 群 关系 简化 图 


本 案例 将 复杂 的 理论 与 社会 网 络 分 析 方法 引入 到 省 际 流动 人 口 研究 一 一 
中 ,根据 实际 的 人 口 流动 建立 复杂 网 络 ,分 析 大 规模 流动 人 口 的 网 络 拓扑 结 | 
构 以 及 以 人 口 流动 量 为 权重 的 网 络 特征 和 流动 人 口 的 空间 分 布 特征 。 通 过。 225 
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对 比分 析 基 于 交通 成 本 和 重力 模型 测度 的 预期 人 口 流 动 与 实际 人 口 流动 的 
分 布 ,建立 了 基于 交通 、 经 济 和 人 口 流动 的 改进 重力 模型 ,测度 省 际 之 间 的 
人 口 流动 强度 ,以 省 份 为 节点 ,省 际 预 期 的 人 口 流动 强度 为 连接 边 ,构建 省 
际 预期 流动 人 口 有 向 网 络 ,借助 复杂 网 络 分 析 方法 和 社会 网 络 分 析 工 具 
UCINET ,探讨 了 网 络 的 中 心性 .凝聚 性 、 无 标 度 性 以 及 小 世界 特征 。 本 案 
例 研究 有 助 于 政府 管理 部 门 为 流动 人 口 管理 以 及 产业 布局 提供 科学 决策 。 

通过 对 省 际 实 际 人 口 流 动 网 络 以 及 省 际 预期 人 口 流 动 网 络 的 分 析 , 得 
到 以 下 几 点 结论 : 

(1) 大 规模 实际 人 口 流动 网 络 呈 现 小 世界 特征 ,无 标 度 特征 不 明显 , 度 
分 布 指数 较 小 ,流动 人 口 网 络 的 异 质 性 比较 高 ,网 络 中 不 同 度 值 的 节点 分 布 
均匀 。 

(2) 地 区 较 高 经 济 发 展 水 平和 较 大 人 口 总 量 产生 对 外 来 人 口 较 强 的 吸 
引力 。 实 际 流出 人 口 省 份 主要 集中 在 以 安徽 和 河南 为 代表 的 中 部 地 区 ,人 
口 流入 大 省 主要 集中 在 北上 广 以 及 东部 沿海 等 经 济 较为 发 达 的 省 份 , 其 中 
新 疆 作 为 国家 西部 开发 的 重点 区 域 ,在 近年 来 的 人 口 流入 省 份 中 占有 重要 
地 位 。 

G) 基于 交通 、 经 济 和 人 口 的 改进 重力 模型 测度 的 预期 省 际 人 口 流动 网 
络 分 析 得 出 ,预期 流动 人 口 网 络 的 整体 中 心性 不 是 很 强 ,网 络 中 存在 大 量 地 
位 相对 平等 的 节点 ,未 来 人 口 流动 依然 活跃 于 中 东部 地 区 ,呈现 两 纵 的 格 
局 : 中 部 狭长 区 域 人 口 流 出 为 主 ,东部 沿海 狭长 区 域 人 口 流 入 为 主 , 其 中 网 
络 指标 显示 ,未 来 山东 省 和 安徽 省 在 人 口 的 迁 出 和 迁 入 方面 都 处 于 网 络 中 
相对 重要 的 关键 地 位 ,控制 着 人 口 流 动 网 络 的 人 力 资源 流动 。 

(4) 西部 城市 在 预期 的 省 际 大 规模 流动 人 口 网 络 中 运用 结构 洞 的 能 力 
较 弱 , 受 限 制 性 比较 大 ,对 其 他 省 市 的 人 口 流动 依赖 性 比较 强 。 全 网 分 为 八 
个 子 群 社团 ,具有 明显 的 地 域 分 布 特征 , 受 空 间 以 及 人 口 经 济 因素 的 影响 ， 
部 分 社团 之 间 联 系 频繁 ,帮派 性 相对 较为 明显 .网 络 具 有 较 高 的 聚 类 系数 和 
较 小 的 平均 距离 ,小 世界 特征 明显 ,具有 较 强 的 局 部 聚集 性 和 整体 连通 性 。 
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821 关联 关系 矩阵 构建 


1. 信息 组 织 关 联 关 系 纸 阵 

对 集合 A= (ar ,as，…,a,) ,为 了 表示 方便 ,将 信息 组 织 a;(s 二 1,2,…， 
nn) 简 记 为 信息 组 织 s。 令 aj (i,j 二 1,2,…,n) 表 示 信 息 组 织 i 向 信息 组 织 j 
共享 的 信息 数量 (类 ) 或 信息 流量 (次 /天 ), 则 信息 组 织 的 关系 矩阵 Pa K 
IH: 


Base as y ies 
一 般 情况 下 ,aj 关 aj;; s H ag =MCM 表示 足够 大 的 正 数 ) 。 
2MR-ERARARBE 
S B= (bi ,bs，…,bs} RA w 类 信息 的 集合 ,为 了 表示 方便 ,将 信息 
b(t 二 1,2,…,w) 简 记 为 信息 to 
对 信息 4, 令 Q@, 二 (Cu scar ett Cw)? HEE 
0， 组 织 * 是 信息 上 的 需求 方 
G= (5 = 1,2, snt = 1,2, w) 
1, AAs RERE t 的 需求 方 
(8.1) 
则 组 织 -信息 关联 关系 矩阵 
Cus Crs s Cw 


C219 C229 eeto Cow 


Pu = (Qi :Q25° Qu) = 
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一 般 情 况 下 ,一 个 信息 组 织 至 少 有 一 类 信息 ,因此 wn, 
3 信息 关联 关系 矩 阵 
对 信息 i 和 信息 j, 令 bi; 表示 信息 i 与 信息 7 的 共同 需求 方 数量 ,有 


b; = shoes Gj = 1,2,°,w) (8. 2) 
刀 越 大 ,说 明 信 息 i Si fee A 7 的 关联 程度 越 高 。 
构建 信息 的 关联 关系 矩阵 


bus bus s Du 

bas bn, s, baw 
Ps = 

bar bar y Bw 


和 矩阵 Ps 满足 关系 : Db; ==b; + DOKb; Kn—2. 
4 URRE i 和 信息 7 之 间 的 距离 ,将 关系 矩阵 Ps 转换 为 距离 
矩阵 


/ / , 
bus bus s biw 
, , 
, bas bzs, …， Daw 
Ps= 
if / / 
Burs Dues ts Daw 


822 信息 协同 网 络 的 凝聚 子 群 分 析 


凝聚 子 群 (cohesive subgroup) 包 括 派系 (cliques) m JR AK m RIK RDA, 
入 核 等 多 种 类 型 。 一 个 派系 是 一 个 行动 者 的 子 集合 , 子 集合 中 行动 者 之 间 的 
联系 相对 比较 紧密 。 理 解 网 络 结构 及 个 体 嵌 入 性 的 一 个 重要 途径 就 是 对 子 
结构 (或 子 群 派系 等 ) 的 分 析 。 

对 信息 协同 网 络 的 凝聚 子 群 分 析 主 要 建立 在 * 子 群 内 外 关系 ”的 基础 
上 ,通过 构建 块 模型 (block model) 划 分 子 群 ,进行 小 群体 的 量化 研究 。 块 模 


型 的 构建 主要 通过 CONCOR 聚 类 方法 实现 。McQnuitty 于 1968 ERM T 
相关 系数 矩阵 迭代 的 收敛 性 ,Breiger 等 于 1975 年 将 这 种 和 迭代 方法 命名 为 
CONCOR 算法 。 近 年 来 人 们 将 其 用 于 聚 类 ,并 称 为 CONCOR 聚 类 ,主要 应 
用 于 将 网 络 结构 分 成 不 同 的 子 群 或 块 ,得 到 树 型 图 ,发 现 网 络 中 的 结构 特 
点 ,然后 对 结果 进行 分 析 理 解 。 

CONCOR 聚 类 的 基本 思想 与 其 他 方法 不 同 。 这 种 聚 类 方法 对 数据 没 
有 特别 要 求 ,任何 数据 都 可 使 用 ,主要 借助 于 矩阵 的 CONCOR 变换 。 

定义 1 CONCOR 变换 : 若 A= (ai ),x 是 一 个 nn 行 m 列 的 矩阵 , 则 以 
A 的 i 行 与 j 行 的 相关 系数 


(aa —6i) (ax —6;) 
bs = (8. 3) 


= (aa —8;)? 2 (ax —5;)? 

为 矩阵 B= (by Jaxa hY i 行 j 列 元 素 ,这 里 6;,6; 分 别 是 A 的 第 i 行 及 第 j 行 
的 平均 值 ,矩阵 B 称 为 4 的 CONCOR 变换 , 记 作 B=CONCOR(A). 

利用 CONCOR 变换 进行 CONCOR 聚 类 的 过 程 如 下 : 

(1) HÆ nXm ERE V = (wi Jax EP vy ASI. 1S jm) WH i 
对 象 在 第 j 个 属性 上 的 取 值 。 

(2) 令 CG =CONCOR(V) «+++ C, = CONCOR (Cp: ) + ++ + HE AE (UF 
列 Cy Cy ote C FETE PRK SL, GENE EP BR V E n Xm 阶 矩 阵 
之 外 ,Ci ,Cs，…,C,，… 都 是 nXn 阶 和 矩阵 。 

(3) 将 这 个 极限 矩阵 中 相等 的 各 行 所 对 应 的 对 象 作为 一 类 ,就 是 对 个 
对 象 的 CONCOR 聚 类 。 

(4) 如 果 聚 类 结果 不 能 满足 用 户 的 要 求 (截止 条 件 , 如 类 数 大 于 某 个 值 
或 各 类 的 对 象 个 数 小 于 某 个 值 等 ), 则 对 每 一 类 对 应 的 子 阵 继续 进 
CONCOR 聚 类 ,将 每 一 类 进一步 细 分 ;不 断 循环 该 过 程 ,直到 满足 截止 条 件 
为 止 。 
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对 信息 组 织 关系 矩阵 Pa 和 信息 距离 矩阵 Ps ,由 于 不 同 的 子 群 中 存在 一 
定 的 交叉 关系 ,在 CONCOR 聚 类 的 基础 上 ,利用 UCINET 中 的 凝聚 子 群 相 
关 算 法 进行 进一步 的 派系 分 析 ,凝聚 成 若干 个 存在 交叉 关系 的 子 群 (或 多 级 
子 群 )。 其 中 ,对 信息 协同 网 络 中 的 ww 类 信息 , 令 wH wi 十 ze ,rw 表示 与 其 
他 信息 之 间 没 有 共同 需求 方 或 只 有 1 个 共同 需求 方 的 信息 数量 ,ws 表示 与 其 
他 信息 之 间 存 在 两 个 及 以 上 共同 需求 方 的 信息 数量 。 存 在 两 个 及 以 上 共同 需 
求 方 的 多 源 信 息 之 间 具 有 信息 融合 的 可 能 性 ,是 网 络 结构 分 析 的 重点 。 


823 多 源 信 息 协 同 模式 的 纵向 优化 策略 


从 信息 协同 网 络 的 纵向 结构 上 ,根据 多 源 信息 协同 的 关系 测度 分 析 , 在 
多 级 凝聚 子 群 的 基础 上 ,将 PCP 模式 转变 为 以 领域 为 中 心 的 二 级 (或 多 级 ) 
P2N 模式 。 一 方面 ,通过 改变 信息 流向 ,将 控制 端 前 移 , 利 于 具有 共性 需求 
的 信息 协同 流程 管控 ; 另 一 方面 ,对 来 自 不 同 信息 组 织 `. 具 有 相同 需求 方 的 
信息 预先 进行 整合 ,从 而 优化 信息 协同 的 路 径 , 降 低 信息 协同 网 络 的 复杂 
度 ,减少 需求 端 信息 重复 整合 的 次 数 , 提 高 信息 流转 的 效率 。 二 级 协同 网 络 
内 部 的 模式 优化 策略 和 过 程 与 一 级 协同 网 络 相同 。 


应 用 案例 7 智慧 城市 多 源 信息 协同 的 评价 与 优化 T) 


在 应 用 案例 5 中 介绍 了 某 智 慧 城市 多 源 信息 协同 的 差异 化 水 平 评 价 与 
模式 优化 策略 。 下 面 继续 对 该 市 的 多 源 信息 协同 网 络 进行 分 析 。 

对 24 个 信息 组 织 建立 关系 和 矩阵 Pa ,得 到 有 向 赋 权 网 络 图 ( 见 图 8.7)。 
其 中 ,节点 大 小 表示 信息 组 织 的 协同 信息 量 , 边 的 属性 值 表示 信息 流量 , 边 
的 方向 表示 信息 流向 。 

对 155 类 协同 信息 建立 距离 矩阵 Ps ,其 中 共同 需求 方 一 2 的 信息 74 类 ， 
HARRIS 的 信息 81 类 。 对 存在 两 个 及 以 上 共同 需求 方 的 协同 信息 进 
行 分 析 , 子 群 分 布 如 图 8. 8 所 示 。 
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图 8.8 某 智 慧 城市 基础 运行 领域 的 协同 信息 子 群 分 布 
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由 图 8. 8 可 知 ,81 类 信息 分 成 4 个 一 级 子 群 ( 见 表 8. 12) 。 
表 8.12 协同 信息 的 一 级 子 群 分 布 


一 级 子 群 子 群 1 子 群 2 子 群 3 子 群 4 
包含 的 信息 类 数 4 2 11 64 


其 中 一 级 子 群 4 中 又 包含 5 个 二 级 子 群 ( 见 表 8.13). 


表 8.13 一 级 子 群 4 的 二 级 子 群 分 布 


二 级 子 群 子 群 1 子 群 2 子 群 3 子 群 4 FHS 
包含 的 信息 类 数 4 4 7 19 30 
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对 和 矩阵 Pa 和 和 矩阵 Ps 进行 凝聚 子 群 中 的 CONCOR 聚 类 和 派系 分 析 , 发 
现 信息 组 织 在 信息 协同 方面 具有 明显 的 领域 凝聚 性 。 从 总 体 结构 来 看 , E 
要 分 为 7 个 子 群 ( 见 图 8.9) 。 


图 8.9 某 智 慧 城市 基础 运行 领域 的 信息 组 织 协同 子 群 分 布 


由 结果 分 析 可 知 , 城 市 生命 线 管理 (市 政 、 质 监 、 供 水 排水、 电力、 燃气 、 
热力 )、 流 动人 口 管理 (应 急流 管 ) ,城管 执法 (经 信 、 城 管 )、 安 防 急 救 (消防 、 
TE RD) 、 危 险 化 学 品 管理 (安全 监管 气象, 交通、 公安 等 )、 应 急 防汛 ( 交 


N 
人 


通 、 水 务 、 国 土 等 ) ,市政 管 理 (市 政 \ 环 保 、 消 防 )7 个 领域 的 信息 组 织 具 有 较 
强 的 凝聚 性 ,信息 协同 应 用 程度 较 高 。 

此 外 ,交通 与 气象 .交通 与 水 务 .市政 与 环保 等 领域 之 间 具 有 较 强 的 凝 
聚 性 (信息 关联 性 ), 分 别 对 应 当前 大 型 城市 基础 运行 领域 实际 应 用 中 的 几 
个 热点 问题 ,包括 极端 天 气 下 的 交通 保 畅 `. 汛 期 路 面积 水 造成 的 交通 拥堵 、 
空气 质量 与 环境 噪声 监管 等 。 

根据 信息 组 织 的 协同 子 群 分 布 和 信息 的 二 级 子 群 分 布 结果 ,将 传统 的 
PCP 模式 转变 为 7 个 以 领域 牵头 部 门 为 二 级 中 心 的 P2N 模式 。 对 于 凝聚 性 
较 强 的 信息 组 织 间 的 多 源 信息 ,根据 需求 进行 整合 形成 综合 信息 (如 路 面积 
水 点 实时 数据 与 交通 流量 图 层 琶 加 ) ,减少 同类 协同 信息 的 重复 传输 和 需求 
端的 重复 整合 。 通 过 改变 信息 的 流向 ,从 纵向 结构 上 实现 城市 系统 下 的 信 
息 协同 网 络 的 优化 ,提高 信息 协同 的 灵活 度 和 协同 应 用 的 实效 性 。 
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附录 A 中 国 和 美国 政府 的 大 数据 战略 比较 


1. 中 美 政府 大 数据 战略 的 启动 

2012 年 3 月 29 日 ,美国 奥巴马 政府 宣布 启动 * 大 数据 研究 与 开发 计 
划 ”。 该 计划 由 白宫 科技 政策 办 公 室 与 美国 联邦 政府 的 美国 国家 科学 基金 
(NSF) ,美国 国家 卫生 研究 院 (NIH)、 美 国 能 源 部 (DOE)、 美 国 国防 部 
(DOD) .美国 国防 部 高 级 研究 计划 局 (DARPA) 、 美 国 地 质 勘 探 局 (USGS) 六 
个 部 门 共同 制定 ,投入 超过 两 亿美 元 的 资金 ,大 力 推动 和 改善 与 大 数据 相关 
的 收集 ,组 织 和 分 析 工 具 及 技术 ,并 主要 用 于 对 海量 数据 的 访问 、 组 织 与 信 
息 提取 。 

2015 年 8 月 19 日 ,中 国 国 务 院 总 理 李克强 主持 召开 国务 院 常 务 会 议 ， 
通过 (关于 促进 大 数据 发 展 的 行动 纲要 》。9 月 5 日 《国务 院 关 于 印发 促进 
大 数据 发 展 行动 纲要 的 通知 》( 国 发 C2015J]50 号 ) 正 式 发 布 。 这 是 到 目前 为 
止 中 国 促进 大 数据 发 展 的 第 一 份 权威 性 、 系 统 性 文件 ,从 国家 大 数据 发 展 战 
略 全 局 的 高 度 ,提出 了 中 国 大 数据 发 展 的 顶层 设计 ,是 指导 中 国 未 来 大 数据 
发 展 的 纲领 性 文件 ,核心 是 推动 各 部 门 、 各 地 区 、 各 行业 、 各 领域 的 数据 资源 
共享 开放 。 

2 中 美 政府 大 数据 战略 的 宗旨 和 目标 比较 

美国 “大 数据 研究 与 开发 计划 ”的 主要 宗旨 有 三 个 方面 : 一 是 推动 最 新 
的 核心 技术 研发 ,以 用 于 海量 数据 的 收集 、 存 储 \ 保 护 、 管 理 , 分 析 和 共享 ;二 
是 充分 利用 所 研发 的 核心 技术 加 快 科技 与 工程 领域 的 研发 速度 ,加 强国 家 
安全 ,同时 转变 教育 和 学 习 模 式 ; 三 是 培养 更 多 大 数据 技术 开发 与 使 用 方面 
的 专业 人 才 。 

中 国 《 关 于 促进 大 数据 发 展 的 行动 纲要 》 的 主要 目标 有 五 个 方面 : 一 是 
打造 精准 治理 、 多 方 协作 的 社会 治理 新 模式 :二 是 建立 运行 平稳 、 安 全 高 


的 经 济 运行 新 机 制 ;三 是 构建 以 人 为 本 、 惠 及 全 民 的 民生 服务 新 体系 ;四 是 
开启 大 众 创业 ,万 众 创新 的 创新 驱动 新 格局 ;五 是 培育 高 端 智 能 .新兴 繁 荣 
的 产业 发 展 新 生态 。 

3 中 美 政府 大 数据 战略 的 项 目 布局 对 比 

美国 “大 数据 研究 与 开发 计划 ?主要 包括 以 下 项 目 : 美国 国家 科学 基金 
会 和 美国 国家 卫生 研究 院 的 “推进 大 数据 科学 和 工程 的 核心 方法 及 技术 ”、 
美国 国防 部 的 “利用 数据 支持 决策 ”美国 国家 卫生 研究 院 的 “ 千 人 基因 组 计 
划 的 数据 在 亚马逊 云 上 免费 开放 ”美国 能 源 部 的 “通过 高 级 计算 技术 加 速 
科学 发 现 ”、 美 国 地 质 勘探 局 的 “地 球 科学 领域 的 大 数据 ”"、 国 土 安全 部 的 “ 卓 
越 研究 中 心 和 可 视 化 数据 分 析 ”, 以 及 退伍 军人 管理 部 .卫生 和 人 类 服务 部 、 
国家 档案 和 记录 管理 部 .国家 航空 和 航天 局 .国家 人 文 基金 会 .国家 安全 局 
等 部 门 的 一 系列 具体 项 目 。 

中 国 《关于 促进 大 数据 发 展 的 行动 纲要 》 主 要 包括 十 项 具体 工程 ,其 中 
“政府 大 数据 ”工程 4 项 (政府 数据 资源 共享 开放 工程 .国家 大 数据 资源 统筹 
发 展 工程 .政府 治理 大 数据 工程 公共 服 务 大 数据 工程 ),“ 大 数据 产业 ”工程 
5 项 (工业 和 新 兴 产 业 大 数据 工程 .现代 农业 大 数据 工程 ,万众 创新 大 数据 工 
程 、 大 数据 关键 技术 及 产品 研发 与 产业 化 工程 、 大 数据 产业 支撑 能 力 提升 工 
程 ) 及 网 络 和 大 数据 安全 保障 工程 。 

4 美国 政府 大 数据 战略 的 主要 项 目 介绍 

D 美国 国家 科学 基金 会 和 美国 国家 卫生 研究 院 一 一 推进 大 数据 科学 和 
工程 的 核心 方法 及 技术 

美国 国家 科学 基金 会 和 美国 国家 卫生 研究 院 将 对 大 数据 进行 联合 招 
标 , 旨 在 改进 核心 科学 与 技术 手段 ,提高 从 各 种 大 型 数据 集中 提取 重要 信息 
并 对 其 进行 有 效 管理 ,分 析 和 可 视 化 的 能 力 ,加 速 科技 成 果 的 产生 ,并 带领 
国家 进入 一 些 全 新 的 以往 不 可 企及 的 研究 领域 。 其 中 ,卫生 研究 院 对 于 与 
健康 与 疾病 相关 的 数据 集 尤其 感 兴趣 ,包括 影像 .分子 、 细 胞 、 电 生理 学 、 化 
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学 .行为 .流行 病 学 临床 医学 数据 集 。 国 家 科学 基金 会 除了 为 大 数据 招标 
提供 资金 维持 其 关注 的 基础 研究 外 ,还 正在 实施 一 个 全 面 的 .长 期 的 战略 ， 
包括 开发 新 的 方法 ,以 便 更 有 效 地 从 数据 中 进行 知识 获取 ;相关 基础 设施 投 
资 ,用 于 大 数据 科研 团体 的 管理 组织 和 数据 提供 等 ;研究 新 的 教育 和 人 才 
培养 方法 。 采 取 的 具体 举措 包括 : 

(1) 鼓励 研究 型 大 学 设立 跨 学 科 的 研究 生 专 业 课 程 ,以 培养 新 一 代数 据 
科学 家 和 工程 师 人 才 。 

(2) 向 加 利 福 尼 亚 大 学 伯克利 分 校 的 计算 开发 (Expeditions in 
Computing) 项 目 投资 1000 万 美元 ,此 项 目 计划 集成 三 种 强大 的 数据 转 信息 
方法 ,包括 机 器 学 习 、 云 计算 和 众 包 。 

G) 为 “EarthCube” 提 供 第 一 阶段 的 资金 支持 一 一 该 系统 将 允许 地 球 学 
家 获取 、 分 析 和 共享 与 地 球 相关 的 信息 。 

(4) 向 一 个 研究 培训 小 组 发 放 200 万 美元 的 奖金 ,用 于 支持 一 项 大 学 生 
培训 计划 ,教授 他 们 如 何 利用 图 形 和 可 视 化 工具 解析 复杂 数据 。 

(5) 为 一 个 由 统计 学 家 和 生物 学 家 组 成 的 专业 研究 团体 提供 140 万 美 
元 的 研发 资金 ,资助 他 们 研究 蛋白 质 结 构 和 生物 途径 。 

(6) 召集 各 个 学 科 和 领域 的 研究 人 员 ,共同 探讨 如 何 利用 大 数据 转变 教 
育 与 学 习 模式 。 

2) 美国 国防 部 一 一 利用 数据 支持 决策 

美国 国防 部 “在 大 数据 上 压 下 了 巨大 赌注 ”, 每 年 将 投资 2.5 亿美 元 左右 
(其 中 6000 万 美元 用 于 支持 新 的 研究 项 目 ) 在 各 个 军事 部 门 开展 一 系列 研究 
WR, SE: 

(1) 以 创新 方式 使 用 海量 数据 ,通过 感知 . 认 知 和 决策 支持 的 结合 ,建立 
真正 能 够 独立 完成 操控 并 做 出 决策 的 自治 式 系 统 。 

(2) 提高 作战 人 员 和 分 析 人 员 的 环境 与 状况 感知 能 力 ,增强 对 任务 和 流 
程 的 支持 。 国 防 部 的 目标 是 将 分 析 人 员 从 任意 语言 文字 资料 中 提取 信息 的 
能 力 提高 100 倍 ,同时 希望 他 们 观察 到 的 目标 、 活 动 和 事件 的 数量 也 获得 相 


同 幅 度 的 提升 。 

具体 的 项 目 包 括 : 

(1) 多 尺度 异常 检测 项 目 。 旨 在 解决 大 规模 数据 集 的 异常 检测 和 特征 
化 。 目 前 多 尺度 异常 检测 应 用 程序 能 够 进行 内 部 威胁 检测 ,以 及 在 日 常 网 
络 活动 环境 中 检测 单独 的 异常 行动 。 

(2) 网 络 内 部 威胁 计划 。 旨 在 开发 新 的 方法 来 检测 军事 计算 机 网 络 与 
网 络 间谍 活动 。 

(3) 洞悉 计划 。 主 要 解决 现 有 情报 、 监 视 和 侦察 系统 的 不 足 ,进行 自动 
化 和 人 机 集成 推理 ,使 得 能 够 提前 对 时 间 敏 感 的 更 大 潜在 威胁 进行 分 析 。 
该 计划 和 旨 在 开发 出 资源 管理 系统 ,通过 分 析 图 像 和 非 图 像 的 传感器 信息 和 
其 他 来 源 的 信息 ,进行 网 络 威胁 的 自动 识别 和 非常 规 的 战争 行为 。 

(4) 阅读 机 项 目 。 旨 在 实现 人 工 智 能 的 应 用 和 发 展 学 习 系统 的 过 程 中 
对 自然 文本 进行 知识 插入 ,而 不 是 依靠 昂贵 和 费时 的 知识 表示 目前 的 进程 ， 
并 需要 专家 和 相关 知识 工程 师 所 给 出 的 语义 表示 信息 。 

(5) 想象 力 项 目 。 旨 在 为 机 器 建立 视觉 的 智能 。 传 统 的 机 器 视觉 研究 
的 对 象 选 取 广 泛 的 物体 来 描述 一 个 场景 的 属性 名 词 ,而 想象 力 项 目 旨 在 增 
加 在 这 些 场景 的 动作 认识 和 推理 需要 的 知觉 认 知 基础 。 

(6) 使 命 导向 的 高 适应 性 云 项 目 。 通 过 技术 进行 检测 ,诊断 并 对 攻击 做 
出 响应 ,有 效 地 建立 “社区 卫生 服务 系统 ”的 云 ,以 解决 云 计算 固有 的 安全 挑 

该 方案 还 旨 在 开发 新 技术 ,使 云 应 用 和 基础 设施 在 受到 攻击 时 能 够 继 
续 运 行 。 

(7) 对 加 密 数 据 的 编程 计算 的 研究 工作 。 旨 在 开发 实用 的 方法 、 相 关 现 
代 化 计算 编程 语言 ,使 数据 加 密 时 仍然 能 使 用 云 计算 环境 ,用 户 可 在 不 需 首 
次 解密 的 情况 下 操纵 加 密 的 数据 ,从 而 使 得 对 手 拦截 信息 更 加 困难 。 

(8) 视频 ,图像 的 检索 和 分 析 工 具 计 划 。 旨 在 开发 一 个 系统 ,能 够 利用 
军事 图 像 分 析 员 收集 的 数据 进行 大 规模 的 军事 图 像 分 析 。 该 项 目 如 果 成 
功 , 将 使 分 析 师 能 够 在 相关 活动 发 生 时 建立 警报 。 
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此 外 ,美国 国防 部 高 级 研究 计划 局 将 开展 XDAT A 项 目的 研究 工作 , 计 
划 在 未 来 四 年 每 年 投入 2500 万 美元 开发 能 够 分 析 海 量 半 结 构 化 数据 (如 表 
格 数据 ,关系 数据 .分 类 数据 ,元 数据 ) 和 非 结 构 化 数据 (如 文本 文档 .消息 流 
量 等 ) 的 计算 技术 和 软件 工具 。 需 要 解决 的 核心 问题 包括 : 开发 可 扩展 的 算 
法 ,用 于 处 理 分 布 式 数据 存储 库 中 的 不 规则 数据 ;创建 有 效 的 人 机 交互 工 
具 , 用 于 支持 面向 各 种 处 理 任 务 的 快速 可 定制 视觉 分 析 。XDATA 项 目 将 支 
持 开放 源 软件 工具 集 , 以 帮助 开发 机 构 灵 活 开 发 软件 ,使 用 户 能 够 尽快 实现 
海量 数据 处 理 能 力 , 与 特定 国防 应 用 的 任务 数据 流 保持 同步 。 

3) 美国 国家 卫生 研究 院 一 一 千 人 基因 组 计划 的 数据 在 亚马逊 云 上 免费 
开放 

美国 国家 卫生 研究 院 宣 布 .由 国际 千 人 基因 组 计划 创建 的 最 大 的 人 类 
遗传 变异 研究 数据 集 在 亚马逊 网 站 云 服 务 (AWS) 上 免费 公开 。 截 至 目前 ， 
数据 量 已 经 达到 大 约 200TB, 相 当 于 1600 万 个 塞 满 文本 资料 的 文件 柜 或 3 
万 多 个 标准 DVD 的 容量 。 该 数据 集 的 规模 极为 庞大 ,几乎 没有 哪个 研究 机 
构 具 有 足够 的 计算 能 力 对 其 进行 有 效 利 用 。 现 在 AWS 将 千 人 基因 组 计划 
数据 集 免费 公开 , 供 研究 人 员 自 由 访问 和 使 用 ,他 们 只 需 为 自己 使 用 的 计算 
服务 付费 。 

4) 美国 能 源 部 一 一 通过 高 级 计算 技术 加 速 科学 发 现 

美国 能 源 部 将 斥资 2500 万 美元 建立 可 扩展 数据 管理 ,分 析 与 可 视 化 
(SDAV) 研 究 所 。 在 能 源 部 劳伦斯 伯克利 国家 实验 室 (Lawrence Berkeley 
National Laboratory) 的 组 织 下 ,SDAYV 研究 所 将 汇集 6 大 国家 实验 室 和 7 
所 著名 大 学 的 专业 知识 和 经 验 来 开发 新 工具 ,帮助 科学 家 对 能 源 部 超级 计 
算 机 上 的 数据 进行 有 效 管理 和 可 视 化 处 理 。 此 举 将 进一步 简化 和 加 速 开发 
流程 ,使 科学 家 们 能 够 利用 能 源 部 的 研究 设施 开展 更 加 卓有成效 的 科学 研 
究 和 发 现 。 目 前 能 源 部 的 超级 计算 机 上 同时 运行 的 数据 流 在 规模 和 复杂 性 
方面 均 呈 现 不 断 增长 的 势头 ,因此 对 这 些 新 型 工具 的 需求 也 更 加 迫切 。 开 
展 的 主要 项 目 计划 包 括 : 


(1) 高 级 科学 计算 研究 办 公 室 提供 数据 管理 、 可 视 化 和 数据 分 析 集 群 ， 
包括 数字 化 保存 和 集群 访问 。 

(2) 高 性 能 存储 系统 是 对 磁盘 和 磁带 系统 上 PB 级 数据 进行 管理 的 数据 
管理 软件 。 由 美国 能 源 部 和 IBM 开发 的 高 性 能 存储 系统 已 在 世界 各 地 的 大 
学 和 实验 室 投 入 使 用 ,可 用 在 数字 图 书馆 以 及 宇航 局 和 国会 图 书馆 等 部 门 。 

(3) 高 性 能 存储 系统 能 够 对 千 万 亿 次 的 数据 分 析 处 理 , 从 庞大 的 科学 数 
据 集 提 取信 息 ,发 现 其 主要 特征 并 理解 其 间 的 关系 。 系 统 应 用 极为 广泛 , 包 
括 宇宙 学 和 天 气 数据 、 传 感 器 数据 等 。 

(4) 下 一 代 网 络 方案 支持 工具 使 得 在 进行 重大 发 现时 能 够 实现 合作 研 
究 。 现 今 , 每 月 有 超过 1PB 的 科学 数据 为 开放 式 科 学 网 格 、 地 球 系统 网 格 等 
提供 服务 。 工 具 中 的 中 间 件 被 得 克 萨 斯 大 学 、 软 件 公 司 、 石 油 公司 使 用 ,并 
一 起 培养 学 生 利用 先进 的 石油 工程 方法 和 集成 的 工作 流程 。 

(5) 基础 能 源 科学 办 公 室 的 科学 用 户 设施 旨 在 协助 用 户 实现 数据 管理 
和 分 析 大 数据 ,可 每 天 进行 将 一 个 单一 的 实验 数据 扩容 到 最 大 1012 字 节 的 
数据 的 工作 ,可 以 最 大 限度 地 提高 数据 的 可 用 性 及 更 有 效 地 利用 同步 加 速 

(6) 生物 和 环境 研究 计划 。 大 气 辐射 测量 气候 研究 设施 是 一 个 多 平台 
的 科学 用 户 设施 ,提供 重要 的 大 气 现象 的 精确 观测 研究 ,主要 用 于 应 对 从 数 
以 百 计 的 文件 中 迅速 采集 和 提交 解决 方法 的 挑战 ,以 满足 用 户 的 需求 。 

(7) 系统 生物 学 知识 库 是 一 个 社区 驱动 的 软件 框架 ,可 实现 对 微生物 、 
植物 和 环境 条 件 下 的 生物 群落 功能 的 数据 驱动 的 预测 。 系 统 生 物 学 知识 库 
是 开放 式 的 设计 与 开发 环境 ,可 以 提高 算法 的 开发 和 部 署 效率 ,并 增加 异 构 
数据 源 的 实验 数据 的 获取 和 集成 。 

O 通过 聚变 能 源 科学 办 公 室 和 高 级 科学 计算 研究 办 公 室 合作 ,开发 的 
数据 管理 技术 ,包括 高 性 能 的 输入 /输出 系统 .先进 的 科学 的 工作 流程 和 框 
架 、 可 视 化 技术 的 融合 需求 ,已 经 吸引 了 欧洲 一 体 化 建 模 的 注意 ,以 及 一 个 
国际 核 聚 变 研究 和 工程 项 目的 关注 。 
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(9) 高 能 物理 计算 计划 能 够 协助 企业 进行 大 数据 管理 ,包括 分 布 式 分 析 
产品 以 及 高 性 能 ,快速 .可 扩展 访问 多 种 数据 存储 库 的 容错 软件 。 

(10) 美国 核 数 据 计 划 是 一 个 多 方面 努力 ,涉及 7 个 国家 实验 室 和 两 所 
大 学 的 项 目 ,提供 跨越 多 个 领域 的 专用 数据 库 , 包 括 核 物 理 、 编 译 和 交叉 检 
查 以 及 对 所 有 原子 核 的 重要 性 质 的 相关 实验 结果 等 。 

5) 美国 地 质 勘 探 局 一 一 地 球 科 学 领域 的 大 数据 

约翰 。 威 斯 利 。 鲍威尔 数据 分 析 和 合成 中 心 致力 于 推动 地 球 科学 领域 
的 思维 创新 和 技术 进步 , 它 为 科学 家 们 创造 了 开展 深层 次 分 析 、 探 索 尖 端 计 
算 功 能 和 协作 工具 的 机 会 和 条 件 , 这 些 功 能 和 工具 对 于 挖掘 巨型 数据 集 的 
价值 具有 重大 意义 。 这 些 大 数据 项 目 将 增进 我 们 对 许多 重要 问题 的 认识 ， 
包括 气候 变化 .地震 发 生 率 和 未 来 的 生态 指标 对 于 地 球 物种 产生 的 影响 。 

6) 国土 安全 部 一 一 卓越 研究 中 心 和 可 视 化 数据 分 析 

通过 对 大 量 的 异 构 数 据 进 行 研究 ,使 得 急救 员 可 以 发 现 人 为 或 自然 灾 
害 、. 铠 怖 事件 和 需要 执法 的 边境 安全 问题 以 及 网 络 威胁 的 炸药 。 

7) 退伍 军人 管理 部 

由 医疗 保健 信息 研究 所 开发 的 自然 语言 处 理工 具 , 能 够 对 在 退伍 军人 
管理 部 以 文本 形式 存储 的 大 量 数据 进行 信息 解锁 。 

目前 ,退伍 军人 管理 部 正在 努力 通过 保护 作战 人 员 使 用 文字 处 理 算法 
捕获 公共 卫生 事件 ,正在 开发 一 个 的 生产 透明 、 可 重复 使 用 的 各 种 安全 相关 
的 事件 监控 软件 ,以 研究 为 基础 的 监控 程序 ,能 够 跟踪 、 测 量 与 军事 部 署 相 
关 的 健康 条 件 。 

8) 卫生 和 人 类 服务 部 

(1) 疾病 控制 和 预防 中 心 。 生 物 传 感 2. 0 是 第 一 个 在 考虑 区 域 和 国家 
协调 的 情况 下 ,通过 互 操作 的 网 络 系统 对 公众 健康 意识 进行 可 行 性 分 析 的 
系统 , 它 建立 在 现 有 的 国家 和 地 方 的 能 力 之 上 。 生 物 传 感 2. 0 移 除 许多 单 片 
物理 结构 相关 的 成 本 ,可 对 最 终 用 户 透 明 的 分 布 式 系统 方面 ,以 及 做 出 适当 
的 分 析 和 报告 的 数据 访问 。 


(2) 医疗 保险 和 医疗 补助 服务 中 心 。 基 于 Hadoop 的 一 个 数据 仓库 正 
处 于 研发 阶段 , 它 将 支持 医疗 保险 和 医疗 补助 要 求 的 分 析 和 报告 。 其 主要 
目标 是 建立 可 持续 的 、 可 扩展 的 设计 ,可 容纳 在 数据 仓库 中 进行 积累 ,并 补 
充 现 有 的 技术 。 

O 食品 与 药品 管理 局 。 虚 拟 实验 室 环境 将 结合 现 有 的 资源 和 能 力 , 使 
虚拟 实验 室 数据 网 络 具 备 先进 的 分 析 和 统计 工具 ,能 够 分 析 、 预 测 和 促进 公 
众 健康 的 文档 管理 ,并 且 在 世界 范围 内 的 合作 中 赋予 亲临 现场 的 能 力 ,使 任 
何 地 点 在 一 小 时 内 就 具备 在 同一 个 虚拟 实验 室 工作 的 功能 。 

9) 国家 档案 和 记录 管理 部 

为 十 亿 电 子 记录 的 网 络 基 础 设施 提供 一 个 联合 机 构 主 办 的 测试 平台 。 
这 个 多 机 构 主 办 的 网 络 基础 设施 将 用 于 国家 档案 馆 87 万 多 样 化 的 数字 记录 
的 文件 和 信息 的 收集 ,可 称 为 计算 研究 所 的 “文艺 复兴 ”。 这 个 试验 平台 具 
有 评估 技术 、 方 法 和 超大 规模 数据 收集 的 功能 ,以 支持 可 持续 的 访问 。 

10) 国家 航空 和 航天 局 

美国 国家 航空 航天 局 的 地 球 科学 数据 和 信息 系统 项 目 将 持续 超过 15 
年 。 它 将 致力 于 关注 用 户 满意 度 ,努力 确保 科学 家 和 公众 对 数据 的 访问 ,以 
便 从 太空 对 地 球 进行 研究 ,推动 地 球 系统 科学 的 发 展 ,以 应 对 气候 和 环境 变 
化 的 挑战 。 

全 球 地 球 观测 系统 通过 国际 间 努 力 合作 进行 地 球 观测 数据 共享 和 整 
合 。 美 国 宇航 局 已 经 与 美国 环境 保护 署 .美国 国家 海洋 、 大 气管 理 局 以 及 其 
他 机 构 和 国家 的 力量 强 强 联手 ,整合 卫星 ,地面 监测 和 建 模 系统 ,评估 环境 
条 件 和 预测 人 为 和 自然 的 森林 火灾 、 人 口 增长 和 其 他 方面 的 结果 。 研 究 人 
员 将 在 短期 内 整合 各 种 复杂 的 空气 质量 信息 ,从 而 更 好 地 了 解 和 解决 空气 
质量 对 环境 和 人 体 健康 的 影响 。 

太空 行动 协议 由 美国 宇航 局 和 Cray 公司 订立 ,在 “大 数据 ”系统 的 发 展 
和 低 延迟 的 应 用 为 中 心 的 一 个 或 多 个 项 目 上 进行 合作 。 该 项 目测 试 的 混合 
计算 机 系统 的 实用 程序 能 够 使 用 一 个 高 度 集 成 的 非 SQL 数据 库 作 为 数据 传 
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输 的 手段 ,加速 执行 建 模 和 分 析 软 件 。 

太空 望远镜 科学 研究 所 作为 美国 宇航 局 的 分 布 式 空 间 科 学 数据 服务 的 
一 个 组 成 部 分 ,提供 多 任务 存档 的 支持 ,及 各 种 天 文 数据 档案 和 相关 的 科学 
数据 ,包括 光学 、 紫 外 线 、 近 红外 光谱 等 光学 相关 的 科学 数据 。 太 空 望远镜 
科学 研究 所 支持 多 种 工具 ,可 以 对 各 种 光谱 图 像 数 据 进 行 访问 。 

11) 国家 人 文 基金 会 

数据 挖掘 的 挑战 旨 在 分 析 大 数据 的 变化 对 人 文 社会 科学 的 影响 ,这 种 
新 的 计算 为 基础 的 研究 方法 需要 搜索 .分 析 和 理解 大 量 的 材料 ,如 数字 化 的 
书籍 和 报纸 数据 库 , 利 用 网 络 搜索 .传感器 和 手机 记录 交易 数据 。 在 国家 人 
文 基金 会 的 领导 下 ,这 个 挑战 性 的 研究 工作 将 由 美国 和 8 个 国际 组 织 在 四 个 
国家 中 进行 。 

12) 国家 安全 局 

竞争 网 络 防 御 规 模 的 情境 意识 的 培养 和 测试 将 探索 数据 可 视 化 的 网 上 
竞赛 ,从 开始 与 识别 此 类 事件 设计 与 最 佳 执行 方法 上 ,进行 庞大 的 计算 机 网 
络 防御 上 的 数据 可 视 化 开发 。 

情报 共同 体 通 过 与 美国 政府 、 学 术 界 和 工业 界 各 种 各 样 的 合作 伙伴 确 
定 一 套 协调 .宣传 和 活动 方案 ,将 网 络 安全 与 大 数据 相 结合 ,使 学 术 界 了 解 

国家 安全 局 /中 央 安 全 服务 部 的 商业 解决 方案 中 心 通过 供应 商 的 能 力 
演示 ,展示 了 新 的 商业 技术 的 发 展 ,以 满足 国家 安全 局 / 中 央 安 全 服务 部 和 
国家 安全 社区 的 战略 需求 。 

5 中 国政 府 大 数据 战略 的 主要 项 目 介绍 

1) 政府 数据 资源 共享 开放 工程 

其 目的 是 : 推动 政府 数据 资源 共享 。 制 定 政府 数据 资源 共享 管理 办 法 。 

形成 政府 数据 统一 共享 交换 平台 。 到 2018 年 ,在 中 央 政 府 层 面 实 现金 
BK. U.S SA. SER. ER. EK. SAS BASIE 


过 统一 平台 进行 数据 共享 和 交换 。 

形成 国家 政府 数据 统一 开放 平台 。 建 立 政府 部 门 和 事业 单位 等 公共 机 
构 数据 资源 清单 ,制定 实施 政府 数据 开放 共享 标准 ,制订 数据 开放 计划 。 

2) 国家 大 数据 资源 统筹 发 展 工程 

整合 各 类 政府 信息 平台 和 信息 系统 。 在 地 市 级 以 上 ( 含 地 市 级 政府 集 
中 构建 统一 的 互联 网 政务 数据 服务 平台 和 信息 惠 民 服 务 平台 。 

整合 分 散 的 数据 中 心 资 源 。 构 建 形成 布局 合理 、 规 模 适 度 、 保 障 有 力 、 
绿色 集约 的 政务 数据 中 心 体系 。 开 展区 域 试点 。 

加 快 完善 国家 基础 信息 资源 体系 。 到 2018 年 , 跨 部 门 共享 校 核 的 国家 
人 口 基 础 信息 库 、 法 人 单位 信息 资源 库 、 自 然 资源 和 空间 地 理 基础 信息 库 等 
国家 基础 信息 资源 体系 基本 建成 。 

加 强 互联 网 信息 采集 利用 。 制 订 、 完 善 互 联网 信息 保存 相关 法 律 法 规 ， 
构建 互联 网 信息 保存 和 信息 服务 体系 。 

3) 政府 治理 大 数据 工程 

推动 宏观 调控 决策 支持 、 风 险 预 警 和 执行 监督 大 数据 应 用 。 探 索 建 立 
国家 宏观 调控 决策 支持 、 风 险 预 警 和 执行 监督 大 数据 应 用 体系 。 

推动 信用 信息 共享 机 制 和 信用 信息 系统 建设 。 鼓 励 互联 网 企业 运用 大 
数据 技术 建立 市 场 化 的 第 三 方 信用 信息 共享 平台 ,建设 企业 信用 信息 公示 
系统 ,初步 建成 社会 信用 体系 。 

建设 社会 治理 大 数据 应 用 体系 。 实 时 采集 并 汇总 分 析 政 府 部 门 和 企 事 
业 单 位 的 市 场 监管 .检验 检测 .违法 失信 、 企 业 生 产 经 营 、 销 售 物 流 、 投 诉 举 
报 、 消 费 维 权 等 数据 。 

4) 公共 服务 大 数据 工程 

医疗 健康 服务 大 数据 。 建 设 覆盖 公共 卫生 、 医 疗 服务 、 医 疗 保障 、 药 品 
供应 .计划 生育 和 综合 管理 业务 的 医疗 健康 管理 和 服务 大 数据 应 用 体系 。 

社会 保障 服务 大 数据 。 建 设 由 城市 延伸 到 农村 的 统一 社会 救助 .社会 
福利 .社会 保障 大 数据 平台 。 
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教育 文化 大 数据 。 建 立 各 阶段 适龄 入 学 人 口 基础 数据 库 、 学 生 基 础 数 
据 库 和 终身 电子 学 籍 档案 。 

交通 旅游 服务 大 数据 。 建 立 综合 交通 服务 大 数据 平台 。 建 立 旅游 投诉 
及 评价 全 媒体 交互 中 心 。 

5) 工业 和 新 兴 产 业 大 数据 工程 

工业 大 数据 应 用 。 研 究 推动 大 数据 在 研发 设计 .生产 制造 .经 营 管理 、 
市 场 营销 、 售 后 服务 等 产业 链 各 环节 的 应 

服务 业 大 数据 应 用 。 研 发 面向 服务 业 的 大 数据 解决 方案 。 

培育 数据 应 用 新 业态 。 大 力 培 育 互联 网 金融 .数据 服务 数据 处 理 分 

Bt 数据 影视 .数据 探矿 .数据 化 学 .数据 材料 .数据 制药 等 新 业态 。 

电子 商务 大 数据 应 用 。 电 子 商务 企业 应 依法 向 政府 部 门 报 送 数据 。 

6) 现代 农业 大 数据 工程 

农业 农村 信息 综合 服务 。 建 设 农产品 全 球 生产 .消费 .库存 .进出 口 、 价 
格 .成 本 等 数据 调查 分 析 系 统 工 程 ,构建 面向 农业 农村 的 综合 信息 服务 
PBa 

农业 资源 要 素数 据 共 享 。 建 立 我 国 农业 耕地 E e kc A) Bild, 7K 
资源 ,农业 设施 设备 ,新 型 经 营 主 体 、 农 业 劳 动力 、 金 融资 本 等 资源 要 素数 据 
监测 体系 。 

农产品 质量 安全 信息 服务 。 建 立 农产品 生产 的 生态 环境 、 生 产 资料 、 生 
产 过 程 、 市 场 流通 .加 工 储藏 .检验 检测 等 数据 共享 机 制 。 

7) 万 众 创新 大 数据 工程 

大 数据 创新 应 用 。 鼓 励 企 业 和 公众 发 掘 利用 开放 数据 资源 。 

大 数据 创新 服务 。 研 发 一 批 大 数据 公共 服务 产品 。 

发 展 科 学 大 数据 。 构 建 科学 大 数据 国家 重大 基础 设施 。 发 展 科 学 大 数 
据 应 用 服务 中 心 。 

知识 服务 大 数据 应 用 。 建 立国 家 知识 服务 平台 与 知识 资源 服务 中 心 。 

8) 大 数据 关键 技术 及 产品 研发 与 产业 化 工程 


加 强大 数据 基础 研究 。 探 讨 建立 数据 科学 的 学 科 体系 ;研究 面向 大 数 
据 计 算 的 新 体系 和 大 数据 分 析 理 论 ,探索 建立 数据 科学 驱动 行业 应 用 的 
模型 。 

大 数据 技术 产品 研发 。 加 强 数据 存储 、 整 理 . 分 析 处 理 . 可 视 化 .信息 安 
全 与 隐私 保护 等 领域 技术 产品 的 研发 。 

提升 大 数据 技术 服务 能 力 。 以 应 用 带动 大 数据 技术 和 产品 研发 ,形成 
面向 各 行业 的 成 熟 的 大 数据 解决 方案 。 

9) 大 数据 产业 支撑 能 力 提升 工程 

培育 骨干 企业 。 到 2020 年 ,培育 10 家 国际 领先 的 大 数据 核心 龙头 企 
业 ,500 家 大 数据 应 用 、 服 务 和 产品 制造 企业 。 

大 数据 产业 公共 服务 。 形 成 面向 大 数据 相关 领域 的 公共 服务 平台 。 

中 小 微 企 业 公 共 服 务 大 数据 。 形 成 全 国 统一 的 中 小 微 企业 公共 服务 大 
数据 平台 。 

10) 网 络 和 大 数据 安全 保障 工程 

网 络 和 大 数据 安全 支撑 体系 建设 。 到 2020 年 ,实现 关键 部 门 的 关键 设 
备 安全 可 靠 。 完 善 网 络 安全 保密 防护 体系 。 

大 数据 安全 保障 体系 建设 。 建 设 完善 金融 能源 .交通 .电信 、 统 计 、 广 
电 、 公 共 安 全 、 公 共事 业 等 重要 数据 资源 和 信息 系统 的 安全 保密 防护 体系 。 

网 络 安 全 信息 共享 和 重大 风险 识别 大 数据 支撑 体系 建设 。 建 立 网 络 安 
全 信息 共享 机 制 , 推 动 政府 ,行业 ,企业 间 的 网 络 风 险 信 息 共 享 。 
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MRB GAKMBES) RARA 
附件 要 点 
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1. 开放 数据 是 这 场 全 球 性 运动 的 核心 所 在 


开放 数据 是 一 个 具有 巨大 潜力 的 未 开发 资源 。 它 有 助 于 建设 一 个 更 加 
强大 ,更 加 相互 关联 ,更 好 满足 公民 需求 .激励 创新 和 蓬勃 发 展 的 社会 。 

获取 发布 和 再 利用 G8 政府 提供 的 数据 的 基础 原则 是 : 默认 开放 数据 ; 
注重 质量 和 数量 ;让 所 有 人 都 可 用 :为 改善 治理 发 布 数据 ;为 激发 创新 发 布 
数据 。 

开放 数据 的 益处 能 够 而 且 应 该 为 各 国 公民 享有 。 

2 原则 

1) 原则 1: 默认 开放 数据 

开放 数据 的 免费 获取 以 及 后 续 的 再 利用 有 着 重要 的 社会 和 经 济 价值 。 
政府 要 向 默认 开放 数据 的 方向 转变 。 

“政府 数据 ?这 一 术语 含义 广泛 ,可 以 适用 于 国家 、 联 邦 、 地方 .国际 政 府 
机 构 或 更 广泛 的 公共 部 门 拥 有 的 数据 。 

必须 遵守 各 国 和 国际 的 法 律 法 规 , 尤 其 是 关于 知识 产权 、 个 人 身份 和 敏 
感 信息 的 法 律 法 规 。 

希望 所 有 政府 数据 能 以 默认 方式 公开 发 布 。 同 时 我 们 也 认识 到 ,由 于 
正当 原因 ,一 些 数据 不 能 发 布 。 

2) 原则 2: 注重 质量 和 数量 

政府 和 公共 部 门 持 有 的 大 量 信息 可 能 是 公民 感 兴趣 的 。 

准备 高 质量 的 数据 可 能 需要 时 间 ,并 且 与 各 方 、 国 家 间 以 及 更 广泛 的 开 


放 数 据 用 户 进 行 协商 确定 哪些 数据 优先 发 布 或 改进 是 重要 的 。 
。 发 布 及 时 、 全 面 、 准 确 的 高 质量 开放 数据 。 尽 可 能 地 使 数据 保持 其 原 
始 的 .未 经 改动 的 形式 和 最 好 的 颗粒 度 。 
。 确保 数据 中 的 信息 以 简单 清晰 的 语言 描述 ,使 其 可 以 被 所 有 人 理 
解 ,但 本 宪章 并 不 要 求 翻译 成 其 他 语言 。 
。 确保 数据 都 被 充分 说 明 , 让 消费 者 有 足够 的 信息 来 了 解数 据 的 优势 、 
劣势 .分 析 的 局 限 性 和 安全 要 求 ,以 及 如 何 处 理 数据 。 
。 尽早 发 布 数据 ,允许 用 户 提供 反馈 ,然后 持续 进行 修订 ,确保 开放 数 
据 质量 满足 最 高 标准 。 
3) 原则 3: 让 所 有 人 都 可 用 
数据 的 发 布 方式 应 有 助 于 所 有 人 能 够 获取 和 再 利用 数据 。 
开放 数据 应 该 是 免费 提供 的 ,以 鼓励 它们 被 最 广泛 地 使 用 。 
发 布 开 放 数据 时 ,应 当 没 有 诸如 注册 登记 等 阻止 人 们 访问 数据 的 官 傣 
或 行政 障碍 。 
。 尽 可 能 以 开放 格式 发 布 数据 ,确保 数据 被 最 广泛 的 用 户 在 最 广泛 的 stable 
用 途中 使 用 ; 
。 尽 可 能 多 地 发 布 数据 ,对 于 现在 不 能 免费 提供 的 数据 ,增加 补贴 ,以 
鼓励 其 免费 提供 。 在 许多 情况 下 ,这 将 包括 提供 多 种 格式 的 数据 ,以 
便 它 们 可 以 用 计算 机 处 理 并 被 人 们 所 理解 。 
4) 原则 4: 为 改善 治理 发 布 数据 
开放 数据 的 发 布 有 利于 加 强 民 主 制度 建设 和 促进 更 好 的 政策 制定 ,以 
满足 公民 需求 。 这 不 仅 在 我 们 自己 的 国家 如 此 ,在 世界 各 地 都 是 如 此 。 
其 他 多 边 组 织 和 机 构 对 开放 数据 的 兴趣 越 来 越 大 。 
。 与 各 方 及 世界 其 他 国家 分 享 技术 和 经 验 , 让 每 个 人 都 能 从 开放 数据 
中 获 益 。 
。 通过 在 线 记 录 所 有 相关 流程 ,确保 数据 采集 、 标 准 和 发 布 过 程 的 
透明 。 247 
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5) 原则 5: 为 激励 创新 发 布 数据 
认识 到 多 样 性 在 激励 创造 力 和 创新 方面 的 重要 性 ,我 们 同意 ,使 用 我 们 
的 数据 的 个 人 和 组 织 越 多 ,产生 的 社会 和 经 济 效 益 就 越 大 。 这 对 于 商业 和 
非 商 业 用 途 都 是 适用 的 。 
。 努力 营造 开放 数据 文化 并 鼓励 应 用 程序 开发 者 、 从 事 开 放 数 据 推广 
工作 的 民间 社会 组 织 等 挖掘 开放 数据 的 价值 。 
。 通过 以 机 器 可 读 的 格式 提供 数据 ,壮大 未 来 数据 创新 者 队伍 。 


B2 ，” 售 开 放 数 据 宪 章 》 技 术 附件 要 点 


1. 最 佳 实践 

1) 原则 1: 默认 开放 数据 

认识 到 开放 数据 的 重要 性 ,希望 所 有 政府 数据 能 以 默认 方式 公开 发 布 。 

。 在 公开 的 声明 如 公告 .战略 或 政策 中 明确 开放 数据 的 定位 ,以 使 推进 
开放 数据 的 计划 进程 在 司法 上 是 清晰 明确 的 。 

。 发 布 一 个 国家 行动 计划 ,依据 (G8 开放 数据 宪章 ) 的 原则 , 细 化 开放 
数据 的 计划 。 

。 在 国家 的 门户 网 站 上 发 布 数据 ,使 所 有 已 经 公布 的 政府 数据 可 以 很 
容易 在 一 个 地 方 找到 。 门 户 可 能 是 一 个 可 以 从 上 面 下 载 数据 的 中 心 
网 站 ,或 是 一 个 列 出 所 有 存储 在 不 同位 置 的 政府 开放 数据 的 网 站 。 
每 个 门户 网 站 将 包括 一 个 列 出 所 有 数据 和 元 数据 的 注册 表 文 件 , 同 
时 为 开发 者 提供 应 用 编程 接口 (APIs)。 如 果 不 可 能 在 一 个 门户 网 
站 上 公布 所 有 数据 , 那 就 要 清楚 地 展现 数据 位 置 ,而 且 在 没有 通知 的 
情况 下 不 能 进行 转移 。 

2) 原则 2: 注重 质量 和 数量 

发 布 的 数据 既 要 注重 质量 ,又 要 注重 数量 。 以 有 助 于 人 们 理解 并 使 用 

的 方式 发 布 数据 ,这 将 有 助 于 提高 不 同 政策 领域 .企业 或 国家 数据 的 互 操 


fete. 

。 使 用 稳定 和 一 致 的 元 数据 ( 即 描述 实际 数据 的 字段 或 元 素 ) 。 

© TE G8 内 发 布 和 维护 一 个 最 新 的 核心 描述 性 元 数据 字段 映射 ,让 来 自 
世界 各 地 的 人 们 能 够 更 容易 使 用 和 理解 。 这 将 使 目前 还 没有 一 个 数 
据 门户 的 G8 或 非 G8 国家 ,考虑 采用 这 个 映射 中 包含 的 元 数据 
字段 。 

。 确保 数据 描述 充分 ,以 帮助 用 户 充分 了 解数 据 。 这 可 以 包括 : 提供 
数据 字段 使 用 说 明 的 文档 ;链接 不 同 数据 的 数据 字典 ;一 个 描述 数据 
采集 目的 .目标 受众 .样品 特征 ,以 及 数据 采集 方法 的 用 户 指南 。 

。 倾听 数据 用 户 的 反馈 ,以 改善 所 提供 数据 的 广度 质量 和 可 访问 性 。 
这 可 通过 国家 数据 战略 或 政策 的 公共 咨询 .与 民间 组 织 的 讨论 、 在 数 
据 门户 网 站 建立 反馈 机 制 等 形式 ,或 通过 其 他 的 适当 机 制 来 实现 。 

3) 原则 3: 让 所 有 人 都 可 用 

数据 的 发 布 方式 应 有 助 于 所 有 人 能 够 获取 和 再 利用 数据 。 

。 以 方便 的 开放 格式 提供 数据 ,确保 文件 可 以 很 容易 地 被 所 有 常用 的 bl 
网 络 搜索 应 用 工具 检索 、 下 载 、 索 引 和 查找 。 开 放 的 格式 是 指 那些 可 
供 任 何人 免费 使 用 的 规范 格式 ,如 非 专 有 的 纯 文本 逗号 分 隔 符 文件 
(CSV) ,从 而 使 文件 中 包含 的 数据 能 够 被 不 同 的 软件 程序 打开 。 

4) 原则 4: 为 改善 治理 发 布 数据 

数据 是 可 以 提升 政府 效能 、 效 率 和 快速 响应 公民 需求 的 有 力 工具 ,同时 

又 能 进一步 激发 开放 数据 的 需求 。 

。 与 民间 社会 组 织 和 个 人 建立 联系 ,让 公众 反馈 他 们 最 想 要 政府 发 布 
的 数据 。 

"为 了 使 数据 标准 更 加 开放 ,应 该 考虑 : 其 他 国家 和 国际 组 织 发 布 的 
数据 ;来 自 其 他 国际 增加 透明 度 行动 的 标准 。 

。 记录 我 们 在 开放 数据 工作 上 的 经 验 ,例如 ,发 布 开放 数据 政策 实践 
和 门户 网 站 的 技术 信息 ,使 其 他 国家 共享 开放 数据 的 益处 。 249 
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5) 原则 5: 为 激发 创新 发 布 数据 
公民 可 以 在 自己 的 国家 和 世界 范围 内 使 用 我 们 的 数据 来 推动 创新 。 免 
费 获取 和 再 利用 开放 政府 数据 是 推动 创新 的 基本 因素 。 

。 支持 使 用 开放 许可 证 或 者 其 他 相关 措施 发 布 数据 同时 尊重 知识 
产权 一 一 这 样 除 特殊 情况 下 ,针对 商业 和 非 商 业 目的 的 信息 再 利用 
将 不 受 限制 或 者 免费 。 

。 提供 结构 良好 的 数据 以 确保 机 器 可 以 批量 读 取 ,从 而 使 自动 处 理 和 
访问 时 需要 下 载 的 文件 最 少 。 

。 使 用 应 用 程序 接口 (APIs) 发 布 数据 ,并 在 适当 的 情况 下 ,确保 经 常 定 
期 更 新 和 访问 的 数据 可 以 被 便捷 地 获取 。 

。 通过 各 国 组 织 竞赛 .奖励 或 者 指导 数据 用 户 等 形式 ,鼓励 创新 使 用 我 
们 的 数据 。 

2 共同 行动 
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1) 行动 1: G8 国家 行动 计划 

发 布 各 国 的 国家 行动 计划 ,详细 介绍 各 国 如 何 依据 自己 的 国家 框架 执 
行 (G8 开放 数据 宪章 )(2013 年 10 月 )。 

报告 年 度 进展 (通过 G8 问 责 工作 组 )(2014 年 和 2015 年 ) 。 

2) 行动 2: 发 布 高 价值 数据 

K B. 1 中 的 领域 的 数据 对 改善 民主 和 鼓励 创新 性 的 数据 再 利用 具有 很 


F 


高 的 价值 。 
表 B.1 数据 分 类 与 数据 集 示例 
数据 分 类 ( 按 字母 顺序 排列 ) 数据 集 示例 
公司 公司 /企业 登记 
犯罪 与 司法 犯罪 统计 、 安 全 
= 地 球 观测 气象 /天 气 、 农 业 、. 林 业 、 渔 业 和 狩猎 
二 一- 一 教育 学 校 名 单 . 学 校 表现 .数字 技能 
= a 能 源 与 环境 污染 程度 .能源 消耗 


续 表 


数据 分 类 ( 按 字母 顺序 排列 ) 数据 集 示例 
pd BA te he 、 
财政 与 合同 i FHER bp Hr BY ATH 
地 理 空间 地 形 、 邮 政 编码 、 国 家 地 图 、 本 地 地 图 
全 球 发 展 援助 .粮食 安全 ,采掘 业 、 土 地 
政府 问 责 与 民主 ee 
健康 处 方 数 据 ` 效 果 数 据 
科学 与 研究 基因 组 数据 ,研究 和 教育 活动 .实验 结果 
统计 国家 统计 \ 人 口 普 查 、 基 础 设施 .财产 .从 业 人 员 
社会 流动 性 与 福利 住房 .医疗 保险 和 失业 救济 
交通 运输 与 基础 设施 公共 交通 时 间 表 、 宽 带 接 入 点 及 普及 率 


按照 “默认 开放 数据 ”" 和 “注重 质量 和 数量 ”的 原则 ,积极 推进 这 些 数 据 
的 开放 。 

第 一 步 将 共同 推进 有 关 国 家 统计 、 国 家 地 图 、 国 家 选举 和 国家 预算 的 关 
键 数据 集 的 建设 和 发 布 ( 自 2013 年 6 月 起 ) ,同时 ,努力 改善 其 颗粒 度 和 可 访 
问 性 (截至 2013 年 12 H). 

所 有 G8 成 员 的 共同 行动 有 助 于 消除 障碍 和 提出 创新 的 解决 方案 ,以 应 
对 面临 的 挑战 。 各 方 要 共同 努力 ,加 大 国家 关键 领域 (如 民主 和 环境 ?等 ) 的 
政府 开放 数据 的 提供 力度 。 

根据 各 国 的 国家 框架 ,在 各 国 的 国家 行动 计划 中 对 如 何以 及 何 时 发 布 
其 余 类 别 数 据 进 行 六 述 (2013 年 10 H). 

3) 行动 3: 元 数据 映射 

继续 维护 G8 元 数据 映射 的 实践 活动 (2013 年 6 月 )。 该 映射 可 以 在 
Github 网 站 查看 ,包括 一 个 横 跨 G8 成 员 的 元 数据 映射 索引 集合 和 一 个 有 关 
各 G8 成 员 在 其 国家 门户 使 用 元 数据 的 详细 页 面 。 


O 目录 和 数据 集 最 终 确 定 于 2013 年 12 月 。 


中 We 


WAFER at Pe (dhs Ba FES BD) ) 


251 


SHU BES e+ Sek Ss tS—AS cows e 


F 


252 


附录 C 信息 协同 服务 接口 的 WL Scere 


描述 


1. 数据 库 协同 请 求 对 象 XML Shem 描述 


< ?nl version= "1.0" encoding= "UIF- 8"?> 
<xs:schama xmlns:xs= "http: //www.w3.org/2001/¥MLSchema" 
elementFormefault= "qualified"> 
<xs:element name= "DRExRequest"> 
<xs:camplexType> 
< xs:sequence> 
<xs:element ref= "version"/> 
<xs:element ref= "senderCode"/> 
<xs:element ref= "senderAppCode"/> 
<xs:element ref= "resourceID"/> 
<xs:element ref= "resourceName"/> 
<xs:element ref= "userID"/> 
<xs:element ref= "userName"/> 
<xs:element ref= "timeStamp"/> 
<xs:element ref= "messageID"/> 
<xs:element ref= "receiver" maxOoours= "urbounded"/> 
< /xs:sequence> 
< /xs:complexType> 
< /xs:element> 
<xs:element name= "messageID" type= "xs:string"/> 
<xs:element name= "receiver" type= "ReceiverType"/> 
<xs:element name= "receiverAppCode" type= "xs:string"/> 
<xs:element name= "receiverCode" type= "xs:string"/> 
<xs:element name= "resourceID" type= "xs:string"/> 
<xs:element name= "resourceName" type= "xs:string"/> 
<xs:element name= "senderAppCode" type= "xs:string"/> 
<xs:element name= "senderCode" type= "xs:string"/> 
<xs:element name= "timeStanp" type= "xs:string"/> 
<xs:element name= "userID" type= "xs:string"/> 
<xs:element name= "userName" type= "xs:string"/> 
<xs:element name "version" type= "xs:string"/> 


<xs:complexType name= "ReceiverType"> 
<xsisequence> 
<xs:element ref= "receiverCode"/> 
<xs:element ref "receiverAppCode"/> 
< /xs:sequence> 
< /xs:complexType> 
< /xs:schema> 


数据 库 协 同 请 求 对 象 参数 见 表 C. 1 。 


RCL 数据 库 协同 请 求 对 象 参 数 
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参数 名 称 参数 类 型 参数 说 明 
version String 服务 版 本 号 
senderCode String 发 送 方 机 构 编码 
senderAppCode String 发 送 方 应 用 系统 编码 
resourceID String 资源 标识 符 
resourceName String 资源 名 称 
userID String 用 户 标识 符 
userName String 用 户 名 称 bl 
timeStamp String 时 间 截 
messageID String 消息 标识 符 
receiver ReceiverT ype 接收 方 

接收 方 参数 见 表 C. 2。 
表 C.2 接收 方 (ReceiverType) 参 数 

参数 名 称 参数 类 型 参数 说 明 
receiverCode String 接收 方 机 构 编码 
receiverAppCode String 接收 方 应 用 系统 编码 


2 数据 库 协同 数据 对 象 XML Shem 描述 


< ?aml version= "1.0" encoding= "UIF- 8"2> 


<xs:schema xmlns:xs= "http: //www.w3.ong/2001/¥MLSchema" 


elementFormefault= "qualified"> 


253 


<xs:element name= "DRExData"> 
<xs:camplexType> 
< xSisequence> 
<xs:element ref= "senderAgpCode"/> 
<xs:element ref= "senderCode"/> 
<xs:element ref= "senderPeerName"/> 
<xs:element ref= "receiverAppCode"/> 
<xs:element ref= "receiverCode"/> 
<xs:element ref= "receiverPeerName"/> 
<xs:element ref= "send?ime"/> 
<xs:element ref= "resourceID"/> 
<xs:element ref= "resouroeType"/> 
<xs:element ref= "userName"/> 
<xs:element ref= "userID"/> 
<xs:element ref= "processName"/> 
<xs:element ref= "dataSet"/> 
< /xs:sequence> 
< /xs:camplexType> 
< /xs:element> 
<xs:element name= "senderAppCode" type= "xs:string"/> 


i ; A | | <xs:element name= "senderCode" type= "xs:string"/> 
<xs:element name= "senderPeerName” type= "xs:string"/> 

<xs:element name= "sendTime" type= "xs:string"/> 
<xs:element name= "userID" type= "xs:string"/> 
<xs:element name= "userName" type= "xs:string"/> 
<xs:element name= "operationType” type= "xs:string"/> 
<xs:element name= "processName" type= "xs:string"/> 
<xs:element name= "reoeiverApoCode" type= "xs:string"/> 
<xs:element name= "receiverCode" type= "xs:string"/> 
<xs:element name= "receiverPeerName" type= "xs:string"/> 
<xs:element name= "resourcelD" type= "xs:string"/> 
<xs:element name= "resourceType" type= "xs:string"/> 
<xs:element name= "dataSet" type= "DataSet Type"/> 
<xs:element name= "recordData" type= "RecordDataType"/> 
<xs:element name= "unitData” type= "UnitDataType"/> 
<xs:camplexType name= "DataSet'Type"> 

<_xs:sequence> 
一 <xs:element name= "operationType" type= "xs:string"/> 

254 <xs:element ref "recordData" maxOoours= "unbounded"/> 
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< /zs:sequence> 
< /xs:complexType> 
< xs:complexType name= "RecordDataType"> 
<xs:sequence> 
<xs:element ref= "unitData" maxOccurs= "unbounded"/> 
< /xs:sequence> 
< /xs:complexType> 
< xs:omplexType name= "UnitDataType"> 
< xS:sequence> 
<xs:element name= "mnitIName" type= "xs:string"/> 
<xs:element nare= "UnitDisplayNare” type= "xs:string"/> 
<xs:element name= "unitValue" type= "xs:string"/> 
< /xs:sequence> 
< /xs:camplexType> 
< /xs:schema> 


° WE 


SB} EWOYDS TWX SUBRSAS aay 


数据 库 协 同 数据 对 象 参数 见 表 C. 3。 


RCI 数据 库 协同 数据 对 象 参数 


参数 名 称 参数 类 型 参数 说 明 | 
senderAppCode String 发 送 方 应 用 系统 编码 
senderCode String 发 送 方 机 构 编码 
senderPeerName String 发 送 方 节点 名 称 
receiverAppCode String 接收 方 应 用 系统 编码 
receiverCode String 接收 方 机 构 编码 
receiverPeerName String 接收 方 节点 名 称 
sendTime String 发 送 时 间 
resourcelD String 资源 标识 符 
resourceType String 资源 类 型 
userID String 用 户 标识 符 —- 
userName String 用 户 名 
processName String 交换 流程 名 称 
dataSet DataSetType 交换 的 数据 集 
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数据 集 、 记 录 BES Bt Hill ULE C.4、 表 C. 5 和 表 C.6。 


表 C.4 数据 集 (DataSetType) 参 数 


参数 名 称 参数 类 型 参数 说 明 
operationType String 操作 码 ,I 一 增加 U 一 修改 D 一 删除 
recordData RecordDataType 组 成 数据 集 的 基本 单位 ,表示 一 条 记录 


#C.5 记录 (RecordDataType) 参 数 


参数 名 称 参数 类 型 参数 说 明 


数据 项 ,组 成 数据 记录 的 基本 单位 ,表示 关系 数据 库 
表 中 的 某 个 字段 


unitData UnitDataType 


表 C.6 数据 项 (UnitDataType) 参 数 


参数 名 称 参数 类 型 参数 说 明 
unitIDName String 数据 项 的 标识 符 
unitDisplayName String 数据 项 的 名 称 
unitValue String 数据 项 的 值 


3 文件 协同 请 求 对 象 XML Schama 描述 


<?xml version= "1.0" encoding= "UIF- 8"?> 

<xs:schema xmlns:xs= "http: //www.w3.org/2001/¥MLSchema" 

elementFomDefault= "qualified"> 

<xs:element name= "File&xRequest"> 
<xs:camplexType> 
<_xs:sequence> 

<xs:element ref= "version"/> 
<xs:element ref= "senderCode"/> 
<xs:element ref= "senderAppCode"/> 
<xs:element ref "resourceID"/> 
<xs:element ref= "resourceName"/> 
<xs:element ref "userID"/> 
<xs:element ref= "userNare"/> 
<xs:element ref "timeStanp"/> 


<xs:element ref "messageID"/> 
<xs:elatent ref "sourceFile" maxQoours= "ubounced"/> 
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<xs:element ref "receiver" maxOoours= "unbounded"/> 
< /xs:sequence> 
< /xs:camplexType> 
< /xs:element> 
<xs:element name= "messageID" type= "xs:string"/> 
<xs:element name= "receiver" type= "ReceiverType"/> 
<xs:element name= "receiverAppCode" type= "xs:string"/> 
<xs:element name= "receiverCode” type= "xs:string"/> 
<xs:element name= "resourceID" type= "xs:string"/> 
<xs:element name= "resourceName” type= "xs:string"/> 
<xs:element name= "senderAppCode” type= "xs:string"/> 
<xs:element name= "senderCode" type= "xs:string"/> 
<xs:element name= "sourceFile" type= "SourceFileType"/> 
<xs:element name= "sourceFileName" type= "xs:string"/> 
<xs:element name= "sourceFilePath" type= "xs:string"/> 
<xs:element name= "timeStamp" type= "xs:string"/> 
<xs:element name= "userID" type= "xs:string"/> 
<xs:element name= "userName" type= "xs:string"/> 
<xs:element name= "version" type= "xs:string"/> 
<xs:canplexType name= "ReceiverType"> 
<xs:sequence> 
<xs:element ref= "receiverCode"/> 
<xs:element ref= "receiverAppCode"/> 
< /xs:sequence> 
< /xs:complexType> 
<-xs:canplexType name= "SourceFileType"> 
< xS:sequence> 
<xs:element ref "sourceFileName"/> 
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<xs:element ref "sourceFilePath"/> 


< /xsisequence> 
< /xs:complexType> 
< /xs:schema> 


文件 协同 请 求 对 象 参数 见 表 C. 7。 
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: 表 C.7 文件 协同 请 求 对 象 参数 

$ 参数 名 称 参数 类 型 参数 说 明 

同 version String 服务 版 本 号 

4 senderCode String 发 送 方 机 构 编码 

A senderAppCode String 发 送 方 应 用 系统 编码 

= resourcelD String 资源 标识 符 

i resourceName String 资源 名 称 

A userID String 用 户 标 识 符 

B userName String 用 户 名 称 

A timeStamp String 1a Tia] BK 
messagelD String 消息 标识 
sourceFile SourceFileType 交换 的 文件 数据 
receiver ReceiverType 接收 方 


源 文 件 及 接收 方 参数 分 别 见 表 C. 8 和 表 C. 9。 


is, 表 C.8 源 文件 (SourceFileType) 参 数 


参数 名 称 参数 类 型 参数 说 明 
sourceFileName String 文件 名 
sourceFilePath String 文件 路 径 


表 C.9 接收 方 (ReceiverType) 参 数 


参数 名 称 参数 类 型 参数 说 明 
receiverCode String 接收 方 机 构 编 码 
receiverAppCode String 接收 方 应 用 系统 编码 


4 文件 协同 数据 对 象 XML Shem 描述 


< ?ml version= "1.0" encoding= "UIE- 8"> 
一 一 <xs:schema xmins:xs= "http: //www.w3.org/2001/¥MLSchema" 
-一 一 elementFomMefault= "qualified"> 


258 <xs:element name= "FileExData"> 


<xs:camplexType> 
< xS:sequence> 
<xs:element ref "senderAppCode"/> 
<xs:element ref= "senderCode"/> 
<xs:element ref= "senderPeerName"/> 
<xs:element ref= "reoeiverAppCode"/> 
<xs:element ref= "receiverCode"/> 
<xs:element ref= "receiverPeerName"/> 
<xs:element ref= "sendTime"/> 
<xs:element ref= "resourcelD"/> 
<xs:element ref= "resourceType"/> 
<xs:element ref="userName"/> 
<xs:element ref= "userID"/> 
<xs:element ref= "processName"/> 
<xs:element ref= "dataSet"/> 
< /xs:sequence> 
< /xs:complexType> 
< /xs:element> 
<xs:element name= "dataSet" type= "DataSetType"/> 
<xs:element name= "isBinary" type= "xs:boolean"/> 
<xs:element name= "fileName" type= "xs:string"/> 
<xs:element name= "processName" type= "xs:string"/> 
<xs:element name= "receiverAppCode" type= "xs:string"/> 
<xs:element name= "receiverCode" type= "xs:string"/> 
<xs:element name= "receiverPeerName"” type= "xs:string"/> 
<xs:element name= "resouroeID" type= "xs:string"/> 
<xs:element name= "resourcelype" type= "xs:string"/> 
<xs:element name= "senderAppCode” type= "xs:string"/> 
<xs:element name= "senderCode" type= "xs:string"/> 
<xs:element name= "senderPeerName" type= "xs:string"/> 
<xs:element name= "sendTime" type= "xs:string"/> 
<xs:element name= "fileSize" type= "xs:string"/> 
<xs:element name= "fileType" type= "xs:string"/> 
<xs:element name= "userID" type= "xs:string"/> 
<xs:element name= "userName" type= "xs:string"/> 
<xs:element name= "unitDatan type= "xs:string"/> 
< xs:camplexType name= "DataSetType"> 


° We 
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<xs:sequence> 
<xs:element name= "recordData" type= "RecordDataType" 
maxOccurs= "unbounded"/> 
< /xs:sequence> 
< /xs:complexType> 
<xs:canplexType name= "RecordDataType"> 
<xs:sequence> 
<xs:element ref= "fileName"/> 
<xs:element ref= "fileType"/> 
<xs:element ref "isBinary"/> 
<xs:element ref "fileSize"/> 
<xs:element ref= "unitData"/> 
< /xs:sequence> 
< /xs:camplexType> 
< /xs:schema> 
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文件 协同 数据 对 象 参数 见 表 C. 10。 


表 C.10 文件 协同 数据 对 象 参数 


参数 名 称 参数 类 型 参数 说 明 
senderAppCode String 发 送 方 应 用 系统 编码 
senderCode String 发 送 方 机 构 编码 
senderPeerName String 发 送 方 节点 名 称 
receiverAppCode String 接收 方 应 用 系统 编码 
receiverCode String 接收 方 机 构 编码 
receiverPeerName String 接收 方 节点 名 称 
sendTime String 发 送 时 间 
resourcelD String 资源 标识 符 
resourceType String 资源 类 型 
= userName String 用 户 名 称 
userID String 用 户 标 识 符 
processName String 流程 名 称 
dataSet DataSetType 交换 的 文件 数据 集 
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数据 集 参 数 见 表 C. 11. 
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表 C.11 数据 集 (DataSetType) 参 数 


参数 名 称 参数 类 型 参数 说 明 


recordData RecordDataType 组 成 数据 集 的 基本 单位 ,表示 一 个 文件 
记录 参数 见 表 C. 12。 


表 C.12 记录 (RecordDataType) 参 数 


BES PWEYIS TWX SOR Ras aor 


参数 名 称 参数 类 型 参数 说 明 

fileName String 文件 名 称 

fileType String 文件 类 型 (doc、xls 等 ) 

isBinary Boolean 是 否 为 二 进 制 文件 ,TRUE 表示 二 进 制 ,FALSE 
表示 文本 格式 

fileSize String 文件 大 小 

unitData String 经 过 base64 编码 后 的 文件 内 容 
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Mise D 基于 MATLAB 的 模糊 聚 类 核心 
计算 程序 


1. 数据 标准 化 变换 


function[X]=F 1Y (cs, X) 
if(cs==0) retum; end 
[n, m= size (X); 
if(cs==1) OF BS — brite 22 EM 
for (k= 1:m) xk= 0; 
for(i=1:n) xk=xkt+X(i, k); end 


Bet UT BS eS MS H — DS ce S N 


xk=xk/n; sk= 0; 

for(i=1:n) sk= sk+ (X(i, k)- xk) ^2; end 

sk= sqrt (sk/n); 

for(i=1:n) X(i, k)= (K(i, k)- xk)/sk; end; end 
else % 平 移 - 极 差 变换 


for (k= 1:m) 
infin, xmin=X(1, k); xmax=X(1, k); 
for (i= 1:n) 


if (min X(i, k)) xmin=X(i, k); end 
if (max< X(i, k)) xmex=X(i, k); end; end 
for(i=1:n) X(i, k)= (X(i, k)- min) / (amax- xmin); end; end; end 


2 RDB A ERR 


function [R]=F_2R(cs, X) 
in, m= size (X); R= []7 
if(cs==1) 3 数量 积 法 
ma 0; pd= 0; 
for (i=1:n) for(j=1:n) 
if(j~=i) 0; 
for (k= 1:m) x=x+X(i, k) * X(j, k); end 
if (maxMk x) maxM x; end; end; end; end 
if (max 0.000001) retum; end 
a maxM= maxM+ 1; 
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for(i=1:n) for(j=1:n) 
if(Gi==j) RG, J= 
else 
RG, j)=0; 
for (k-1:m) R(i, j)=R(i, j)+X(i, k) * XG, k); end 
Rü, j)=RG, 3) /ma 
ifR(i, j)<0) pa 1; end; end; end; end 
if (pd) for(i=1:n) for(j=1:n) R(i, j)= RG, j)+1)/2; end; end; end 
elseif (cs==2) KRKE 
for (i= 1:n) for (j= 1:n) xi=0; xj=0; 
for (k= 1:m) xi=xi+X(i, k) * 2; xj=xj+X(j, k) ^2; end 
S= sqrt (xi * xj); 
RG, j)=0; 
for (k= 1m R(i, j)=R(G, j)+X(i, K) * XG, k); end 
R(i, j)=R(i, j)/s; end; end 
elseif (cs= = 3) % 相 关系 数 法 
for(i=1:n) forG=1:n) xi=0; xj=0; 
for (k= 1:m) xi=xi+X(i, k); xj=xj+ XG, k); end 
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xi=xi/m; xj=xj/m; xis=0; xjs=0; 


fok lm xis=xis+ K(i, k)-xi) ^2; xjs=xjst KG, k)-xj) ^2; ed 
Sarar ii atabdlai 
R(i, j)=0; 


for (k= 1:m) R(i, j)=R(i, j)+ abs((K (i, k)- xi) * (KG, k)-xj)); end 
R(i, j)=R(i, j)/s; end; end 
elseif (cs= = 4) % 指 数 相似 系数 法 
for(i=1:n) for(j=1:n) R(i, j)=0; 
for (k= 1:m) xk= 0; 
for(z=1:n) xk= xk+ X(z, k); end 
xk= xk/n; sk= 0; 
for(z=1:n) sk= sk+ (X(z, k)- xk) * 2; end 
sk= sk/n; 
RG, j)=R(i, j)+ exp 0.75* (Ki, K-X(G, k))/sk) ^2); end 
R(i, j)=RG, j)/m end; end 
elseif (cs<=7) % 最 大 最 小 值 法 .算术 平均 最 小 法 .几何 平均 最 小 法 
for(i=1:n) for(j=1:n) fa=0; fme 0; 
for (k= 1:m) 
if(G, k)<0) F []; retum; end 
if&G, k)<X(i, k)) = XG, k); else x X(j, k); end — 
fz fzt x; end 263 


if(cs==5) % 最 大 最 小 值 法 
for(k1:m) ifi, k)>XG, k) = XG, k); else XG, k); ed; ed 
fre fmt x; 

elseif (cs== 6) 3 算术 平均 最 小 法 
for (= 1:m) fre fw (x(i, k)+X(j, k))/2; end 

else $ 几 何平 均 最 小 法 
for (k= 1:m) fr fmt sqrt (K(i, k) * X(j, k)); end; end 

R(i, j)=fz/fin; end; end 

elseif (cs<=10) C=0; 4 直接 距离 法 
for(i=1:n) for(j=i+ 1:n) d@0; 

if (cs==8) 7 $ 欧 几 里 得 距离 
for (k= lim) d=d+ K(i, k)-X(j, k)) ^ 2; end 
sqrt (d) 

elseif (cs== 9) $ 海 明 距 离 
for (k= 1m) dd abs (X(i, k)- X(j, k)); end 

else =H KBR 
for (= lim) if (a abs (X(i, k)- X(j, k))) as (K(i, K)- X(j, k)); en 
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eng; end 
if (<d) C=d; end; end; end 
C(O); 


for(i=1:n) for(j=1:n) d=0; 
if(cs==8) % 欧 几 里 得 距离 


for (k= 1m) d= d+ K(i, k)-X(j, k)) ^2; end 
& sqrt (d)7 
elseif (cs== 9) % 海 明 距 离 
for (k= 1:m) 中 dt abs (X(i, k)- X(G, k)); end 
else HEEREN 
for (= 1m) if(x abs K(i, k)-X(j, k))) d= abs (K(i, k)-X(j, k)); end; 
e; ead 
R(i, j)=1-C* d; end; end 
elseif (c< = 13) $3 倒数 距离 法 
mirM Inf; 
for(i=1:n) for(j=i+1:n) @0; 
if(cs==11) ”% 欧 几 里 得 距离 
for(=1:m ddt K(i, k)-X(j, k)) * 27 end 
spt 
elseif (cs== 12) 3% 海 明 距 离 
=| for (k= 1:m) d=dt abs (K(i, k)-X(j, k)) ^2; end 
264 else s% 切 比 雪夫 距离 


for (k= 1:m) if (d< abs (X (i, k)-X(j, k))) 二 abs (X (i, k)— X(j, k)); 
end; end; end 
if (minM> d) mind; end; end; end 
min 0.9999 * miM; 
if (minK 0.000001) retum; end 
for (i= 1:n) for(j=1:n) Æ 0; 
if(j==i) R(i, j)=1; continuey end 
if (cs==11) % 欧 几 里 得 距离 
for (k= 1:m) dd+ (X(i, k)-X(j, k)) ^2; end 
& sqrt (d); 
elseif (cs== 12) soit HH BB PS 
for (k= 1:m) d= d+ abs (X(i, k)-X(j, k))7 end 
else HEEREN 
for (k= 1:m) 
if (d< abs (X (i, k)- X(3, k))) d= abs (X (i, k)- X(j, k)); end; 
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R(i, j)=minM/d; 
end; end 
else % 指 数 距 离 法 


for(i=1:n) for(j=1:n) d=0; 
if(cs==14) ”% 欧 几 里 得 距离 Pe M 
for (k= lim) d= d+ K(i, k)-X(j, k)) ^2; end 


& sort (A); 
elseif (cs== 15) s% 海 明 距 离 
for (k= 1:m) d= dt abs (K(i, k)- X(G, k)); end 
else s% 切 比 雪夫 距离 
for (k= 1:m) if (d< abs (X (i, k)-X(j; k))) d= abs K(i, k)- X(G, k)); 
end; end; end 
R(i, j)=exp(- d); end; end; end 


3 BAGS MRA ARA,. BRA) 


function [C]=Max Min (A, B) 


Im, s]=size(A); 

[sl, n]=size@®); 

er 

if (sl~=s) retum; end 

for (i=1:m) for (j=1:n) — 
c(i, j)=0; 265 
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For (k=1:s) 0; 
ifAG, K)<Bk, j)) =AG, k); 
else 到 Bo j); end 
if (CG, j)<x) CG, j)=x; end; end; end; end 


4 动态 聚 类 


function F_3BD(R) 
Im, n]=size(R); 
if(w=n | m==0) retum; end 
for (i=1:n) R(i, i)=1; % 修 正 错误 
for (j= i+ 1:n) 
if (i, j)<0) Ri, j)=0; elseif R(i, j)> 1) RG, j)=1; end 
R(i, j)=xound(10000* R(i, j))/10000; Rj, i)=R(i, j); end; end 
js% 0; 
while (1) % 求 传递 闭 包 
RI=Max Min(R, R); js0= js0+1 
if (RI==R) break; else R=Rl; end; end 
Ind (1)=1; 1; 
for(i=1:n) for (j= it 1:n) pe 1; % 找 出 所 有 不 相同 的 元 素 
for («= 1:k) if R(i, j)== lmd(x)) pd= 0; break; end; end 
if (pd) = kt 1; Imd(K)=R(i, j); end; end; end 
for (i= 1:k- 1) for j=it 1:k) % 从 大 到 小 排序 
if(Imd(i)< Im0)) x= Im (j); Imad (j)= Imei); lIm(i)=x; end; end; end 
for (= 1:k) js=0; flsz(x)=0; % 按 Amd (x) 分 类 ,分 类 数 为 fsz (x) ,临时 用 sz 记录 
元 素 序号 
for(i=1:n) Pd=17 
for(y=1:js) if (Sz(y)==i) pd 0; break; end; end 
if (pd) 
for(j=1:n) if RG, j)>= lmd(x)) js=js+ 1; Sz(js)=j; end; end 
flsz (x)= flsz (x)+ 1; end; end; end 
for (i=1:k- 1) for (j=it 1:k) 
if (flsz(j)==flsz(i)) flsz(j)=0; end; end; end 
£1=0; % 排 除 相 同 的 分 类 
for (i=1:k) if (f1sz(i)) fl=fl+1; Imd(£1)=1md(i); end; end 
for (i=1:n) xhsz(i)=i; end 
for (= 1:£1) js=0; flsz (x)=0; 3 获得 分 类 情况 : 对 分 类 元 素 进行 排序 
for(i=1:n) pd=17 
for(y=1:js) if(Sz(y)==i) po= 0; break; end; end 


if (pd) 
if (js==0) y= 0; end 
for (j=1:n) if R(i, j)>= lmd(x)) js=jst+ 1; Sz(js)=j; end; end 
flsz (x)= flsz(x)+ 1; Sz0(flsz(x))=js- y; end; end 
js% 07 
for (i= 1:flsz (x)) 
for (j= 1:Sz0(i)) Sz1(j)=Sz(js0+ j); end 
for (j=1:n) for(y=1:Sz0(i)) 
if (xhsz (j) == Szl (y)) js0= js0+ 1; Sz (js0)= xhsz (j); end; end; 
end; end 
for (i=1:n) xhsz(i)=Sz(i); end; end 
for (= 1:£1) js=0; flsz (x)=0; 3% 获得 分 类 情况 : 每 一 子 类 的 元 素 个 数 
for (i=1:n) p&1; 
for (y= 1:js) if(Sz(y)==1i) po 0; break; end; end 
if (pd) 
if (js==0) y= 0; end 
for (j=1:n) if (R(i, j)>= lmd(x)) js=jst 1; Sz(js)=j; end; end 
flsz (x)= flsz (x)+ 1; Sz0(flsz(x))=js- y; end; end 
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jso= 17 
for (i= 1:flsz(x)) y= 1; 


if (Sz (y)==xhsz (js0)) flgksz (x, i)=Sz0(j)7 js0= js% Sz0 (j); break; end 


y= y+ S200); end; end; end 
F_result= figure('nare', 'S AS RKK ', 'color', 'w') 
axis ('off'); ko 30; G} 40; y= £1 * Gdt Gd; l= 80; text (24, y+ Gd/2, 'A"); 
for (i= 1:n) 
text (lx- 5+ i * Kd- 0.4* Kd* (xhsz(i)>9) , y+Gd/2, int2str (xhsz(i)))7 
line ([lx+ i* Kd, 1x+i* Kd], [y, y-Gd]); linesz(i)=1x+i* Kd; end 
text (Lx* 1.5ti* Kd, y+ Gd/2, ' 分 类 数 '); ye y- Ga 
for (= 1:f1) 
text (8, y- Gd/2, num@str (Imd(x))); js0=1; jsl= 0; 
if @=1) for (i=1:flsz(x)) 
4sl= flgksz (x, i)- 1; 
if (sl) line([linesz(js0) , linesz(js0+js1) ], [y, yl); end 
Line ([ (Linesz (js0+ js1)+ linesz (js0))/2, (Linesz (js0+ js1)+ linesz (js0))/ 
2], [yr y Gal); 
linesz (i)= (Linesz (js0+ js1)+ linesz (js0) ) /2; 
js0= js0+ jsh 1; end 一 一 一 
else for (i= 1:flsz(x)) 267 


jsl= jsl+ flgksz (x, i); js2=0; p® 0; 
for (j= 1:flsz (x- 1)) 
js2= js% flgksz (x-1, j); 
if(js%==js1) pd 1; break; end; end 
if(j~=js0) line([linesz (js0) , Linesz(j) ], [y, yl); end 


Gdl); 
Linesz (i)= (Linesz (js0)+ Linesz (j) )/2; 
js0= 5+ 1; end; end 

text (2* lxtn* Kd, y- Gd/3, int2str(flsz(x))); y= y- Gd; end 
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Line ([ (Linesz (js0)+ linesz (j))/2, (linesz (js0) + Linesz (j))/2], [y, Y- 
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主要 外 文 名 词 缩写 索引 


ADSL: 
ANSI: 


BSI; 


CCSA; 


CDMA; 
CEN: 


CENLEC; 


CPE; 
CRC; 


DAS: 
DIN: 
DKE; 
DM: 
DSS: 


A 


Asymmetrical Digital Subscriber Loop , 非 对 称 数字 用 户 环 路 


American National Standards Institute, 美 国 国家 标准 学 会 
B 

Britain Standards Institute, 英 国标 准 协会 
C 


China Communications Standards Association, ,中 国 通信 标准 化 
协会 

Code Division Multiple Access, 码 分 多 址 

Comité Européen de Normalization [法 ] ,欧洲 标准 委员 会 
European Committee for Electrotechnical Standardization, ,欧洲 
电工 标准 化 委员 会 

Customer Premise Equipment. 用 户 前 置 设 备 

Cyclic Redundancy Check ,循环 宛 余 校 验 


D 


Direct Attached Storage, 直 连 存储 

Deutsches Institut fiir Normung [ 德 ], 德 国标 准 化 协会 
德国 电气 电工 信息 技术 委员 会 

Data Mining ,数据 挖掘 

Decision Support System ,决策 支持 系统 
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DSSO : Decision Support System Optimizer. HR X FF AS (ka 
E 


EFA FTI; Education for All-Fast Track Initiative, 全 民 教 育 -快速 跟踪 计划 


EPC; Electronic Product Code ,产品 电子 代码 
ETSI: European Telecommunications Standards Institute. Kk HH E {a th 
准 化 协会 
G 


HM UBER SHS+S Shs 43— DS e ETE 


GDSS; Group Decision Support System ,群体 决策 支持 系统 


GPE; Global Partnership for Education, EER AAKE HE 
GPRS; General Packet Radio Service ,通用 无 线 分 组 业务 
GPS: Global Positioning System, 全 球 定位 系统 
GSI: Globe Standard 1 ,国际 物品 编码 协会 

inhi, ; 
HA; High Availability ,高 可 用 性 


HDFS: Hadoop Distributed File System, Hadoop 分 布 式 文件 系统 
HDI: Health Data Initiative ,健康 卫生 数据 行动 计划 
HTTP: ”Hypertext Transfer Protocol, 超 文本 传输 协议 


I 
IDC: Internet Data Center, 互 联网 数据 中 心 
IEC: International Electrotechnical Commission ,国际 电工 委员 会 
IEEE: Institute of Electrical and Electronics Engineers ,美国 电气 和 电 


子 工程 师 协会 
276 IOT: Internet of Things, 物 联网 


ISO; 
ITU: 


ITU-T; 


JMS: 


KDD: 


MCU: 


MIMO.: 
MOOC: 


M2M: 


NAS: 


OECD: 


OFDM: 
OLAP: 


OS: 


International Organization for Standardization. ,国际 标准 化 组 织 
International Telecommunication Union ,国际 电信 联盟 
International Telecommunication Union-Telecommunication 


Sector , 国际 电信 联盟 标准 化 部 


Java Message Service,Java 消息 服务 
K 

Knowledge Discovery in Database. 知识 发 现 
M 


Microcontroller Unit , 微 控制 器 

Multiple-Input Multiple-Output ,多 输入 多 输出 
Massive Open Online Courses, 大 型 开放 式 在 线 课程 
Machine to Machine. #L-#L 


N 
Network Attached Storage ,网络 附加 存储 
o 


Organization for Economic Cooperation and Development, % 
合作 与 发 展 组 织 

Orthogonal Frequency Division Multiplexing , 正 交 频 分 复 用 
Online Analytical Processing ,联机 分 析 处 理 

Operating System ,操作 系统 


LU 3 Un] S35 EGR YS Hl He 


277 


SHU BES aS Ssh tS— AS ow se 


278 


PSTN: 


RDF: 
RFID; 


URI: 


3G; 


3GPP: 
4G: 


P 
Public Switched Telephone Network ,公共 电话 交换 网 
R 


Resource Description Framework ,资源 描述 框架 
Radio Frequency Identification ,射频 识别 


Standardization Administration of China, 国家 标准 化 管理 委 
员 会 

Social Network Analysis, 社 会 网 络 分 析 

Service-Oriented Architecture, 面 向 服务 的 体系 结构 


U 


Uniform Resource Identifier, 统 一 资源 标识 符 


The 3rd-Generation Mobile Communication Technology, 第 三 代 
移动 通信 技术 

The 3rd Generation Partnership Project, 第 三 代 合作 伙伴 计划 
The 4th-Generation Mobile Communication Technology, 第 四 代 
移动 通信 技术 
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